Guardare il modello risolvere questi problemi IMO e raggiungere prestazioni a livello oro è stato magico. Alcuni pensieri 🧵
Alexander Wei
Alexander Wei19 lug 2025
1/N Sono entusiasta di condividere che il nostro ultimo LLM sperimentale di ragionamento @OpenAI ha raggiunto una sfida storica nell'IA: prestazioni da medaglia d'oro nella competizione matematica più prestigiosa del mondo—l'Olimpiade Internazionale di Matematica (IMO).
Il modello risolve questi problemi senza strumenti come il lean o la codifica, utilizza solo il linguaggio naturale e ha solo 4,5 ore. Vediamo la ragionamento del modello a un livello molto alto: provare diverse strategie, fare osservazioni da esempi e testare ipotesi.
È pazzesco come siamo passati dal 12% su AIME (GPT 4o) →'oro IMO in ~ 15 mesi. Abbiamo fatto molta strada, molto rapidamente. Non sarei sorpreso se entro il prossimo anno i modelli derivassero nuovi teoremi e contribuissero alla ricerca matematica originale!
796,29K