Upřímně, panel pokročilých uživatelů ve stylu Consumer Reports by mohl být lepší než METR atd. pro měření pokroku AI, mnohem odolnější vůči špičkám. Nechci znít skepticky, jako zkušený uživatel si myslím, že za posledních pár měsíců byl opravdu znatelný pokrok.