Podsumowanie wydarzenia zapoznawczego ARC-AGI-3 @GregKamradt omawia naszą tezę dotyczącą Interaktywnego Benchmarku Rozumowania * Dlaczego statyczne benchmarki nie wystarczają do pomiaru zdolności agentowych * Podejście ARC Prize do tworzenia interaktywnych benchmarków
18,11K