Há algo satisfatório e profundamente estranho quando um LLM relata que corrigiu 37 dos 41 testes com falha (uma melhoria de 90%) e, em seguida, pergunta o que fazer a seguir e interpreta corretamente "Avante!"
23,05K