Tencent släppte SRPO på Hugging Face Direkt anpassning av hela diffusionsbanan till finkorniga mänskliga preferenser Genom att finjustera FLUX1dev-modellen med optimerad denoising och justering av belöningar online kan du förbättra dess mänskligt utvärderade realism och estetiska kvalitet med över 3 gånger vibe kodning av en text till bild AI-app för den i vilken kodare som helst