Récapitulatif de l'événement de prévisualisation ARC-AGI-3 @GregKamradt passe en revue notre thèse sur le Benchmark de Raisonnement Interactif * Pourquoi les benchmarks statiques sont insuffisants pour mesurer les capacités agentiques * L'approche du Prix ARC pour créer des benchmarks interactifs
18,11K