Ik hoor nu een paar fluisteringen van vogels dat interne evaluaties gpt5 een beetje boven grok 4 Heavy hebben. Evaluaties vertellen echter maar één kant van een model, ik ben benieuwd of we enige grote agentische of andere verbeteringen zullen zien.
277,12K