Korejský startup zaměřený na AI Tri-21B-think Preview spustil Tri-21B-think Preview, malý model uvažování s otevřenými vahami, který získal 20 bodů v indexu umělé analytické inteligence Klíčové poznatky z benchmarkingu: ➤ Vysoká, ale ne vedoucí inteligence vzhledem ke své malé velikosti: Tri-21B-think Preview dosahuje vysokých výsledků díky relativně malému počtu 21 miliard parametrů. Model pouze 21B jej činí relativně dostupnější pro vlastní hostování ve srovnání s předními open source modely jako GLM-5 a Kimi K2.5 ➤ Nízká míra halucinací: Tri-21B-think Preview dosahuje -49 v AA-Omniscience Indexu, proprietárním benchmarku umělé analýzy, který měří spolehlivost znalostí a halucinace napříč odvětvími. Toto dobré skóre je primárně způsobeno relativně nízkou mírou halucinací (62 %), což je nejnižší mezi jihokorejskými modely, které porovnáváme. ➤ Síla v používání agentických nástrojů: Tri-21B-think Preview dosahuje 93 % na τ²-Bench Telecom, což ukazuje silný výkon v pracovních postupech pro používání agentních nástrojů. Tri-21B-think Preview mezi předními modely s otevřenou váhou v této kategorii, kde dosahuje podobného skóre jako DeepSeek V3.2 a MiniMax M2.5 ➤ Vysoké využití tokenů: Tri-21B-think Preview vykazuje velmi vysoké využití tokenů ve srovnání s ostatními modely ve stejné úrovni inteligence, přičemž využívá ~120 milionů tokenů pro uvažování v rámci sady umělé analytické inteligence. To je srovnatelné s K-EXAONE (100M rozumové tokeny), dalším korejským modelem ➤ Žádné veřejné koncové body: Tri-21B-think Preview je model s otevřenými váhami pod licencí Apache 2.0. V současnosti je jediný způsob, jak se k modelu přidat, přes self hosting. Trillion Labs sdílela, že se očekává, že v blízké budoucnosti bude zajištěn dedikovaný koncový bod první strany. Další analýzu naleznete níže
Tri-21B-think Preview získává 93 % na τ²-Bench Telecom, což ukazuje silný výkon v pracovních postupech pro používání agentních nástrojů.
Tri-21B-think Preview vykazuje velmi vysoké využití tokenů, využívá ~120 milionů uvažovacích tokenů napříč sadou umělé analytické inteligence.
9,07K