wydaje się, że następne kilka lat rozwoju AI będzie polegać na dużej ilości RL z funkcjami nagrody LLM-as-a-judge. dziwne czasy, w których żyjemy gdzie mogę dowiedzieć się więcej o tym paradygmacie? jakie są najważniejsze blogi i artykuły?
135,75K