Rekapitulace události náhledu ARC-AGI-3 @GregKamradt kroky naší diplomovou prací Interactive Reasoning Benchmark * Proč statické benchmarky zaostávají za měřením agentických schopností * Přístup ARC Prize k vytváření interaktivních benchmarků
18,1K