Este ceva satisfăcător și profund ciudat atunci când un LLM raportează că a remediat 37 din 41 de teste eșuate (o îmbunătățire de 90%) și apoi întreabă ce să facă în continuare și interpretează corect "Înainte!"
26,53K