Tencent lançou SRPO no Hugging Face Alinhando diretamente a trajetória de difusão completa com a preferência humana refinada Ao ajustar o modelo FLUX1dev com redução de ruído otimizada e ajuste de recompensa online, melhore seu realismo avaliado por humanos e qualidade estética em mais de 3x vibe codificando um aplicativo de IA de texto para imagem para ele em anycoder