Resumen del Evento de Vista Previa de ARC-AGI-3 @GregKamradt explica nuestra tesis sobre el Benchmark de Razonamiento Interactivo * Por qué los benchmarks estáticos son insuficientes para medir las capacidades agenciales * El enfoque del Premio ARC para crear benchmarks interactivos
18.1K