モデルが実行できる場合、1つのタスクで真に検証可能なレベルの能力は、AGIまたは超人的なレベルと見なされると思いますか?
13.38K