Ada sesuatu yang memuaskan, dan sangat aneh, ketika LLM melaporkan bahwa mereka telah memperbaiki 37 dari 41 tes yang gagal (peningkatan 90%) dan kemudian bertanya apa yang harus dilakukan selanjutnya, dan dengan benar menafsirkan "Maju!"
20,58K