Tänään julkistamme esikatselun ARC-AGI-3:sta, interaktiivisen päättelyn vertailuarvosta, jossa on laajin kuilu ihmisille helpon ja tekoälylle vaikean välillä Julkaisemme: * 3 peliä (ympäristöt) * 10 000 dollarin agenttikilpailu * AI-agenttien API Lähtöpisteet - Frontier AI: 0 %, ihmiset: 100 %
o3 (vasemmalla) ja Grok 4 (oikealla) uusintaa alla SPOILERI: Kumpikaan ei suorita yhtään tasoa
ARC-AGI-3 Preview -pelit on painetestattava. Järjestämme 30 päivän agenttikilpailun yhteistyössä @huggingface Kehotamme yhteisöä rakentamaan agentteja (ja voittamaan rahaa!)
297,48K