Dòng mô hình nhỏ cho Qwen3.5 vừa được phát hành. Nếu bạn muốn chạy một LLM cục bộ, điều này thật thú vị vì: → mô hình Qwen3.5-9B đủ nhỏ để chạy trên một chiếc Mac Mini cấp nhập cảnh → nó vượt trội hơn các mô hình lớn hơn như GPT-OSS 20B & 120B Và chúng chỉ sẽ ngày càng tốt hơn từ đây.
Qwen
Qwen21:18 2 thg 3
🚀 Giới thiệu dòng mô hình nhỏ Qwen 3.5 Qwen3.5-0.8B · Qwen3.5-2B · Qwen3.5-4B · Qwen3.5-9B ✨ Thông minh hơn, tính toán ít hơn. Những mô hình nhỏ này được xây dựng trên nền tảng Qwen3.5 — đa phương thức bản địa, kiến trúc cải tiến, RL mở rộng: • 0.8B / 2B → nhỏ, nhanh, tuyệt vời cho thiết bị biên • 4B → một nền tảng đa phương thức mạnh mẽ bất ngờ cho các tác nhân nhẹ • 9B → gọn nhẹ, nhưng đã thu hẹp khoảng cách với các mô hình lớn hơn nhiều Và đúng vậy — chúng tôi cũng sẽ phát hành các mô hình cơ bản. Chúng tôi hy vọng điều này sẽ hỗ trợ tốt hơn cho nghiên cứu, thử nghiệm và đổi mới công nghiệp thực tế. Hugging Face: ModelScope:
@MulletOnX
62