He estado trabajando en un nuevo algoritmo de inferencia LLM. Se llama Decodificación Especulativa Especulativa (SSD) y es hasta 2 veces más rápido que los motores de inferencia más potentes del mundo. Colaboración con @tri_dao @avnermay. Detalles en el hilo.