Mendengar beberapa bisikan sekarang dari burung bahwa eval internal memiliki gpt5 sedikit lebih dari grok 4 Heavy. Namun, Evals hanya memberi tahu satu sisi untuk model, penasaran untuk melihat apakah kita mendapatkan peningkatan agen atau lainnya.
277,11K