Taalas, Llama 3 8B'yi kullanıcı başına saniyede 16k jeton ile çalıştırıyor. Bu, Cebras gibi SRAM tabanlı sistemlere kıyasla bile neredeyse bir kat artış. Ana fikir: her çip belirli bir modele özel olarak hazırlanmıştır. Çip modeldir. Sohbet demosu oldukça çılgın: