Sincer, un panou de utilizatori avansați în stilul Consumer Reports ar putea fi mai bun decât METR etc. pentru măsurarea progresului AI, mult mai robust la acuzații. Nu vreau să par sceptic, ca utilizator avansat cred că au fost progrese extrem de vizibile în ultimele luni, pentru ce contează.