Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 только что был выпущен. Давайте оценим его производительность в достижении сложных возможностей, похожих на AGI:
- @grok 4 (Мышление) превосходит @OpenAI GPT-5 (Высокий) как в тестах ARC-AGI-2 (сложное рассуждение), так и в тестах ARC-AGI-1 (менее требовательные).
- Превосходная точность Grok 4 сопровождается значительно более высокими затратами на задачу, варьирующимися от 2 до 4 долларов.
- Более легкие варианты GPT-5 (мини/нано) обеспечивают сбалансированный компромисс между производительностью и стоимостью по этим критериям.
Обратите внимание, что тест ARC-AGI-3 в настоящее время проводится, и результаты вышеуказанных тестов не подразумевают превосходства модели.
h/t @arcprize

1,29K
Топ
Рейтинг
Избранное