ARC-AGI-3 Vorschau-Event Rückblick @GregKamradt erläutert unsere These zum Interaktiven Bewertungsbenchmark * Warum statische Benchmarks bei der Messung agentischer Fähigkeiten versagen * Der Ansatz des ARC-Preises zur Schaffung interaktiver Benchmarks
18,1K