Tencent vydal SRPO na Hugging Face Přímé sladění plné difúzní trajektorie s jemnozrnnými lidskými preferencemi Vyladěním modelu FLUX1dev s optimalizovaným odšumováním a online úpravou odměn zlepšete jeho člověkem vyhodnocený realismus a estetickou kvalitu více než 3x vibe kódování textu na obrázek AI aplikace pro IT v anycoderu