DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Trillion Labs, una startup de IA coreana, ha lanzado Tri-21B-think Preview, un pequeño modelo de razonamiento de pesos abiertos que obtiene 20 en el Índice de Inteligencia de Análisis Artificial Conclusiones clave de la evaluación: ➤ Alta pero no líder en inteligencia para su pequeño tamaño: Tri-21B-think Preview obtiene una puntuación alta por su relativamente pequeño tamaño de 21 mil millones de parámetros. El modelo, al ser solo de 21B, es relativamente más accesible para autoalojarse en comparación con modelos de código abierto líderes como GLM-5 y Kimi K2.5. ➤ Baja tasa de alucinaciones: Tri-21B-think Preview obtiene -49 en el Índice AA-Omnisciencia, un benchmark de Análisis Artificial propietario que mide la fiabilidad del conocimiento y las alucinaciones en diversas industrias. Esta buena puntuación se debe principalmente a una tasa de alucinaciones relativamente baja (62%), que es la más baja entre los modelos surcoreanos que evaluamos. ➤ Fuerza en el uso de herramientas agentivas: Tri-21B-think Preview obtiene un 93% en τ²-Bench Telecom, demostrando un fuerte rendimiento en flujos de trabajo de uso de herramientas agentivas. Tri-21B-think Preview se encuentra entre los modelos de pesos abiertos de vanguardia en esta categoría, obteniendo puntuaciones similares a DeepSeek V3.2 y MiniMax M2.5 en esta categoría. ➤ Alto uso de tokens: Tri-21B-think Preview demuestra un uso de tokens muy alto en comparación con otros modelos en el mismo nivel de inteligencia, utilizando ~120M de tokens de razonamiento en toda la suite de Inteligencia de Análisis Artificial. Esto es comparable a K-EXAONE (100M de tokens de razonamiento), otro modelo coreano. ➤ Sin puntos finales públicos: Tri-21B-think Preview es un modelo de pesos abiertos bajo la licencia Apache 2.0. Actualmente, la única forma de acceder al modelo es a través de autoalojamiento. Trillion Labs ha compartido que se espera que un punto final dedicado de primera parte esté disponible en un futuro cercano. Vea a continuación para un análisis más detallado.

Tri-21B-think Preview obtiene un 93% en τ²-Bench Telecom, demostrando un fuerte rendimiento en flujos de trabajo de uso de herramientas agentivas.

La vista previa de Tri-21B-think demuestra un uso de tokens muy alto, utilizando ~120M de tokens de razonamiento a través de la suite de Inteligencia de Análisis Artificial.

9,06K

Parte superior

Clasificación

Favoritos