parece que os próximos anos de desenvolvimento de IA serão muito focados em RL com funções de recompensa LLM-como-juiz. tempos estranhos em que vivemos onde posso aprender mais sobre este paradigma? quais são os blogs e artigos mais relevantes?
135,76K