Tencent wydał SRPO na Hugging Face Bezpośrednie dostosowanie pełnej trajektorii dyfuzji do szczegółowych preferencji ludzkich Poprzez dostosowanie modelu FLUX1dev z optymalizowanym odszumianiem i dostosowaniem nagród online, popraw realistykę i jakość estetyczną ocenianą przez ludzi o ponad 3x kodowanie vibe aplikacji AI do tekstu na obraz dla tego w anycoder