Co byste považoval za skutečnou ověřitelnou úroveň schopností na jednom úkolu, která by měla být považována za agi nebo nadlidskou úroveň, pokud by toho byl model schopen?
13,37K