Apa yang akan Anda anggap sebagai tingkat kemampuan yang dapat diverifikasi pada satu tugas yang dianggap sebagai agi atau tingkat manusia super jika sebuah model mampu melakukannya?