Jag skulle bli väldigt förvånad om Anthropic inte tränar på dina CC-pass, men inte genom grundläggande RL, - ta den sista git-differentialen - utvinna den högsta signalstyrningen från användaren - neutraliserar brus och ångerutdata - RL det Det skulle vara kontinuerligt lärande