ARC-AGI-3 Voorvertoning Evenement Samenvatting @GregKamradt bespreekt onze Interactive Reasoning Benchmark thesis * Waarom statische benchmarks tekortschieten bij het meten van agentische capaciteiten * De ARC Prize benadering voor het creëren van interactieve benchmarks
18,11K