Ficaria muito surpreso se a Anthropic não estivesse a treinar com as suas sessões de CC, mas não através de RL básico, - pegar a diferença final do git - extrair a orientação de maior sinal do utilizador - eliminar o ruído e as saídas arrependidas - RL isso Isso seria aprendizagem contínua