Zajmuje nam kilka miesięcy przekształcenie eksperymentalnej granicy badań w produkt. Ale postęp jest tak szybki, że kilka miesięcy może oznaczać dużą różnicę w możliwościach.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 lip 2025
Więc wszystkie modele wypadają gorzej niż ludzie w nowych pytaniach z Międzynarodowej Olimpiady Matematycznej, a Grok-4 jest w tym szczególnie zły, nawet przy najlepszym wyborze z n? Niewiarygodne!
128,54K