Há algo satisfatório e profundamente estranho quando um LLM relata que corrigiu 37 dos 41 testes com falha (uma melhoria de 90%) e depois pergunta o que fazer a seguir, interpretando corretamente "Avante!"
20,55K