OpenAI julkaisi juuri GPT-5.4:n ja olemme testanneet sitä Clinessa koko viikon. Huomasimme parannuksen tietokoneen käytössä ja yleisessä tiedossa, ja vertailutulokset tukevat sitä: OSWorld (tietokoneen käytön arviointi) nousi 47,3 %:sta 75,0 %:iin → ylittäen ihmisen suorituskyvyn 72,4%:iin! 🧵
GPT-5.4:llä on myös 1M kontekstiikkuna, mutta heidän arvionsa osoittavat, että neula heinäsuovassa (MRCR v2) saa 97 % pisteitä 16–32 000 tokenilla, putoaa 57 %:iin 256–512 000:ssa ja vain 36 %:iin 512 000–1 000 dollarissa. Siksi on hyvä idea tiivistää säännöllisesti!
52