Levamos alguns meses para transformar a fronteira da pesquisa experimental em um produto. Mas o progresso é tão rápido que alguns meses podem significar uma grande diferença nas capacidades.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 de jul. de 2025
Então, todos os modelos têm desempenho inferior ao dos humanos nas novas questões da Olimpíada Internacional de Matemática, e o Grok-4 é especialmente ruim nisso, mesmo com a seleção melhor de n? Incrível!
128,55K