A Tencent lançou o SRPO no Hugging Face Alinhando diretamente a trajetória completa de difusão com a preferência humana de alta precisão Ao ajustar o modelo FLUX1dev com desnoising otimizado e ajuste de recompensa online, melhora o realismo e a qualidade estética avaliados por humanos em mais de 3x codificação vibe de um aplicativo de IA de texto para imagem para isso no anycoder