C'è qualcosa di soddisfacente e profondamente strano quando un LLM riporta di aver risolto 37 dei 41 test falliti (un miglioramento del 90%) e poi chiede cosa fare dopo, interpretando correttamente "Avanti!"
15,72K