Olen työskennellyt uuden LLM-päättelyalgoritmin parissa. Sitä kutsutaan spekulatiiviseksi spekulatiiviseksi dekoodaukseksi (SSD), ja se on jopa kaksi kertaa nopeampi kuin maailman vahvimmat päättelymoottorit. Yhteistyö @tri_dao @avnermay:n kanssa. Yksityiskohdat ketjussa.