Серія малих моделей для Qwen3.5 щойно зникла. Якщо ви хочете керувати місцевим LLM, це захопливо, бо: → модель Qwen3.5-9B достатньо мала, щоб працювати на базовому Mac Mini → він перевершує більші моделі, такі як GPT-OSS 20B і 120B І далі вони тільки покращуватимуться.
Qwen
Qwen2 бер., 21:18
🚀 Знайомство з серією малих моделей Qwen 3.5 Qwen3.5-0.8B · Qwen3.5-2B · Qwen3.5-4B · Qwen3.5-9B ✨ Більше інтелекту — менше обчислення. Ці малі моделі побудовані на тій самій основі Qwen3.5 — нативний мультимодальний, покращена архітектура, масштабований RL: • 0.8B / 2B → маленький, швидкий, чудовий для edge пристрою • 4B → несподівано міцною мультимодальною основою для легких агентів • 9B → компактний, але вже скорочує відставання з набагато більшими моделями І так — ми також випускаємо базові моделі. Ми сподіваємося, що це краще підтримуватиме дослідження, експерименти та реальні промислові інновації. Обіймаючи обличчя: ModelScope:
@MulletOnX
36