det verkar som att de närmaste åren av AI-utveckling kommer att vara mycket RL med LLM-som-en-domare-belöningsfunktioner. Märkliga tider vi lever i Var kan jag lära mig mer om detta paradigm? Vilka är de mest relevanta bloggarna och tidningarna?
135,89K