腾讯在 Hugging Face 上发布了 SRPO 直接将完整的扩散轨迹与细粒度的人类偏好对齐 通过优化去噪和在线奖励调整微调 FLUX1dev 模型,使其人类评估的真实感和美学质量提高超过 3 倍 为此在 anycoder 中编写一个文本到图像的 AI 应用程序