騰訊在 Hugging Face 上發佈了 SRPO 直接將完整的擴散軌跡與細粒度的人類偏好對齊 通過優化去噪和在線獎勵調整微調 FLUX1dev 模型,使其人類評估的真實感和美學質量提高超過 3 倍 為此在 anycoder 中編寫一個文本到圖像的 AI 應用程序