Je serais très surpris si Anthropic ne s'entraînait pas sur vos sessions CC, mais pas par le biais d'un RL basique, - prendre le dernier git diff - extraire le meilleur signal de guidance de l'utilisateur - éliminer le bruit et les sorties regrettées - RL cela Cela constituerait un apprentissage continu