Eu ficaria muito surpreso se Anthropic não fosse treinar nas suas sessões de CC, mas não durante o RL básico, - Fazer o git diff final - extrair a maior orientação de sinal do usuário - eliminar o ruído e as saídas arrependidas - RL isso Isso seria aprendizado contínuo