Byłbym bardzo zaskoczony, gdyby Anthropic nie trenował na twoich sesjach CC, ale nie przez podstawowe RL, - weź ostateczny git diff - wyodrębnij najwyższy sygnał z użytkownika - wyeliminuj szum i żałowane wyniki - RL to To byłoby ciągłe uczenie się