näyttää siltä, että tekoälyn kehityksen seuraavat vuodet ovat paljon RL:ää, jossa on LLM-as-a-judge -palkitsemistoiminnot. Outoja aikoja, joita elämme Mistä voin oppia lisää tästä paradigmasta? Mitkä ovat tärkeimmät blogit ja paperit?
135,76K