Právě jsem posunul své první víceotáčkové RL prostředí do @PrimeIntellect nastavení: model získá název příběhu + otázku z QuALITY (dlouhé příběhy, otázky s výběrem odpovědí). Pouze nástroj TTS: Agentic RAG prohledává příběh.
12,43K