ARC-AGI-3 プレビュー イベントの要約 インタラクティブ推論ベンチマーク論文の@GregKamradtステップ * 静的ベンチマークがエージェント能力の測定に不十分な理由 * インタラクティブなベンチマークを作成するためのARC賞のアプローチ
18.11K