Theo @ArtificialAnlys, Hyperbolic nổi bật với hiệu suất mạnh mẽ trên các độ dài ngữ cảnh. Mô hình gpt-oss-120b của chúng tôi bởi @OpenAI cung cấp 402 token/giây và duy trì sự ổn định qua các độ dài ngữ cảnh, đưa chúng tôi đứng cạnh những nhà cung cấp suy diễn nhanh nhất.
🚀 Qwen3-Next được hỗ trợ bởi NVIDIA: Đã có mặt tại Hyperbolic
Các chỉ số vượt trội của Hyperbolic cho Qwen3-Next-80B-A3B được hỗ trợ bởi các cụm NVIDIA @nvidia của chúng tôi, với các GPU H100 và H200 theo yêu cầu được tối ưu hóa cho các tác vụ AI. Các GPU H100 và H200 của NVIDIA cung cấp cơ sở hạ tầng của chúng tôi với kiến trúc Hopper, cung cấp khả năng tính toán cần thiết cho các mô hình MoE khổng lồ của Qwen3-Next. Trong khi H100 cung cấp 80GB bộ nhớ HBM3, H200 nâng cấp lên 141GB bộ nhớ HBM3e với hiệu suất tốt hơn lên đến 45%.
Qwen3-Next-80B-A3B Đánh giá: Tại sao Hyperbolic dẫn đầu
Đánh giá gần đây từ @ArtificialAnlys cho thấy Hyperbolic đứng đầu trong Qwen3-Next-80B-A3B-Thinking và Qwen3-Next-80B-A3B-Instruct trên mọi chỉ số quan trọng: tốc độ, độ trễ và chi phí.