M5 Max — это игрушка за 3,500 долларов единственное число, которое имеет значение для локального ИИ: токены/сек что на самом деле имеет значение для вывода LLM (в порядке убывания): пропускная способность памяти → определяет ток/с VRAM/унифицированная память → определяет размер модели вычисления → почти не имеют значения для вывода 25 токенов/сек на 70B звучит впечатляюще, пока не осознаешь, что агентный ИИ нуждается в 100+ токенах/сек, чтобы не казаться сломанным M5 — отличный ноутбук, но не для серверов