Laut @ArtificialAnlys zeichnet sich Hyperbolic durch eine starke Leistung über Kontextlängen aus. Unser gpt-oss-120b Modell von @OpenAI liefert 402 Tokens/Sekunde und bleibt über die Kontextlängen hinweg konsistent, was uns direkt neben die schnellsten Inferenzanbieter stellt.
🚀 NVIDIA-gesteuertes Qwen3-Next: Jetzt live bei Hyperbolic
Die überlegenen Benchmarks von Hyperbolic für Qwen3-Next-80B-A3B werden von unseren NVIDIA @nvidia Clustern unterstützt, die über On-Demand H100- und H200-GPUs verfügen, die für KI-Workloads optimiert sind. Die H100- und H200-GPUs von NVIDIA treiben unsere Infrastruktur mit ihrer Hopper-Architektur an und bieten die Rechenleistung, die für die massiven MoE-Modelle von Qwen3-Next erforderlich ist. Während die H100s 80 GB HBM3-Speicher bieten, bieten die H200s ein Upgrade auf 141 GB HBM3e-Speicher mit bis zu 45 % besserer Leistung.
Qwen3-Next-80B-A3B Benchmarking: Warum Hyperbolic führt
Aktuelle Benchmarking-Ergebnisse von @ArtificialAnlys zeigen, dass Hyperbolic in allen wichtigen Kennzahlen: Geschwindigkeit, Latenz und Kosten, ganz oben bei Qwen3-Next-80B-A3B-Denken und Qwen3-Next-80B-A3B-Anweisungen steht.