Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Korejský startup zaměřený na AI Tri-21B-think Preview spustil Tri-21B-think Preview, malý model uvažování s otevřenými vahami, který získal 20 bodů v indexu umělé analytické inteligence
Klíčové poznatky z benchmarkingu:
➤ Vysoká, ale ne vedoucí inteligence vzhledem ke své malé velikosti: Tri-21B-think Preview dosahuje vysokých výsledků díky relativně malému počtu 21 miliard parametrů. Model pouze 21B jej činí relativně dostupnější pro vlastní hostování ve srovnání s předními open source modely jako GLM-5 a Kimi K2.5
➤ Nízká míra halucinací: Tri-21B-think Preview dosahuje -49 v AA-Omniscience Indexu, proprietárním benchmarku umělé analýzy, který měří spolehlivost znalostí a halucinace napříč odvětvími. Toto dobré skóre je primárně způsobeno relativně nízkou mírou halucinací (62 %), což je nejnižší mezi jihokorejskými modely, které porovnáváme.
➤ Síla v používání agentických nástrojů: Tri-21B-think Preview dosahuje 93 % na τ²-Bench Telecom, což ukazuje silný výkon v pracovních postupech pro používání agentních nástrojů. Tri-21B-think Preview mezi předními modely s otevřenou váhou v této kategorii, kde dosahuje podobného skóre jako DeepSeek V3.2 a MiniMax M2.5
➤ Vysoké využití tokenů: Tri-21B-think Preview vykazuje velmi vysoké využití tokenů ve srovnání s ostatními modely ve stejné úrovni inteligence, přičemž využívá ~120 milionů tokenů pro uvažování v rámci sady umělé analytické inteligence. To je srovnatelné s K-EXAONE (100M rozumové tokeny), dalším korejským modelem
➤ Žádné veřejné koncové body: Tri-21B-think Preview je model s otevřenými váhami pod licencí Apache 2.0. V současnosti je jediný způsob, jak se k modelu přidat, přes self hosting. Trillion Labs sdílela, že se očekává, že v blízké budoucnosti bude zajištěn dedikovaný koncový bod první strany.
Další analýzu naleznete níže

Tri-21B-think Preview získává 93 % na τ²-Bench Telecom, což ukazuje silný výkon v pracovních postupech pro používání agentních nástrojů.

Tri-21B-think Preview vykazuje velmi vysoké využití tokenů, využívá ~120 milionů uvažovacích tokenů napříč sadou umělé analytické inteligence.

9,07K
Top
Hodnocení
Oblíbené
