Працюємо над новим Open Source Grok 2.5! Ми вже змогли це зробити Hot Rod!! Це ранні дні, і він може вийти з ладу, але ми маємо: 268B MoE, 131k контекст, 8 експертів, RoPE, 64 головки уваги GQA з 8 головками KV, 64 шари. У будь-який момент часу нормально активні лише 2 експерти. Ми знайшли спосіб активувати 4 одночасно лише з невеликим падінням продуктивності, лише приблизно на 1/3 більше пам'яті графічного процесора та дивовижним збільшенням якості на виході! Якщо він витримає наші тести, я опублікую детальну інструкцію!
Brian Roemmele
Brian Roemmele24 серп. 2025 р.
I will be rewriting this article to use a compact version of the NEW FREE OPEN SOURCE @xai @Grok 2.5 soon! I will show you how to fine tune the model on your data for private non-cloud use on your computer. This will improve the quality by a magnitude! Working on it…
45,86K