AnthropicがあなたのCCセッションでトレーニングしていないとしたら非常に驚きますが、基本的な強化学習ではそうではありません。 - 最終git差分を取る - ユーザーから最も高い信号誘導を抽出する - ノイズと後悔出力を相殺する - 本当にそうだ それが継続的な学習です