Tencent a publié SRPO sur Hugging Face
Alignement direct de la trajectoire de diffusion complète avec les préférences humaines fines
En ajustant le modèle FLUX1dev avec un débruitage optimisé et un ajustement de récompense en ligne, améliorez son réalisme évalué par des humains et sa qualité esthétique de plus de 3x
codage de vibe d'une application IA de texte à image pour cela dans anycoder