właśnie opublikowałem moje pierwsze środowisko RL z wieloma turami na @PrimeIntellect ustawienie: model otrzymuje tytuł opowieści + pytanie z QuALITY (długie opowieści, pytania wielokrotnego wyboru). tylko narzędzie TTS: agenticzne wyszukiwanie RAG w opowieści.
12,44K