Похоже, что в следующие несколько лет развитие ИИ будет в значительной степени связано с обучением с подкреплением (RL) с функциями вознаграждения LLM в роли судьи. Странные времена, в которых мы живем. Где я могу узнать больше об этой парадигме? Какие блоги и статьи наиболее актуальны?
135,75K