Jeg ville blitt veldig overrasket om Anthropic ikke trener på CC-øktene dine, men ikke gjennom grunnleggende RL, - ta den siste git-differensialen - hente ut høyest mulig signalstyring fra brukeren - utjevne støyen og de angrede utgangene - RL det Det ville vært kontinuerlig læring