Tencent a publié SRPO sur Hugging Face Alignement direct de la trajectoire de diffusion complète avec les préférences humaines fines En ajustant le modèle FLUX1dev avec un débruitage optimisé et un ajustement de récompense en ligne, améliorez son réalisme évalué par des humains et sa qualité esthétique de plus de 3x codage de vibe d'une application IA de texte à image pour cela dans anycoder