Inception Labs ha lanzado Mercury 2, su LLM de difusión de próxima generación listo para producción. Mercury 2 alcanza >1.000 tokens de salida/s con ganancias significativas en inteligencia Los LLMs de difusión ("dLLMs") de @_inception_ai utilizan una arquitectura diferente en comparación con los LLMs basados en autoregresiva. El proceso de generación de LLM de difusión comienza con ruido y refina iterativamente la salida usando un modelo de transformador que puede modificar múltiples tokens en paralelo. Esto permite la paralelización de la generación de tokens de salida, lo que permite velocidades de salida más rápidas porque se generan muchos tokens de salida al mismo tiempo. Puntos clave: ➤ Entre modelos de tamaño y precio comparables, el Mercury 2 rinde de forma competitiva en inteligencia frente a velocidad de salida. Aunque no cuenta con inteligencia líder, su velocidad de salida es más de 3 veces superior al siguiente modelo más rápido de esta clase (benchmarks basados en endpoints de primera mano o en la mediana de proveedores que sirven al modelo donde no hay un endpoint de primera parte disponible) ➤ Las fortalezas clave incluyen codificación agente, uso terminal y seguimiento de instrucciones. Mercury 2 rinde a un nivel similar al Claude 4.5 Haiku en Terminal-Bench Hard y obtiene un 70% en IFBench (Instruction Following), superando gpt-oss-120B, GPT-5.1 Codex mini y GPT-5 nano Antecedentes de Inception Labs: Este es el segundo comunicado de Inception Labs. Los fundadores fueron anteriormente profesores de Stanford, UCLA y Cornell, y han contribuido a la investigación y tecnologías en IA, incluyendo Flash Attention, Decision Transformers y Direct Preference Optimization (DPO). Consulta más abajo para un análisis más detallado.
Comparación de la velocidad de salida con otros modelos (benchmarks basados en endpoints de primera mano o la mediana de proveedores que sirven al modelo donde no hay un endpoint de primera parte disponible)
Mercury 2 rinde por encima del par en comparación con modelos pequeños comparables en varias evaluaciones agentes, incluyendo GDPval-AA, Terminal-Bench Hard y τ²-Bench Telecom, mientras ofrece altas velocidades de salida
Consulta Análisis Artificial para más detalles y referencias de Mercurio 2:
11.37K