Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Trillion Labs, una startup coreana di AI, ha lanciato Tri-21B-think Preview, un piccolo modello di ragionamento con pesi aperti che ottiene 20 nell'Artificial Analysis Intelligence Index
Punti chiave del benchmarking:
➤ Intelligenza alta ma non leader per le sue piccole dimensioni: Tri-21B-think Preview ottiene punteggi elevati per la sua relativamente piccola dimensione di 21 miliardi di parametri. Il modello, essendo solo 21B, è relativamente più accessibile per l'auto-ospitazione rispetto ai modelli open source leader come GLM-5 e Kimi K2.5
➤ Basso tasso di allucinazione: Tri-21B-think Preview ottiene -49 nell'AA-Omniscience Index, un benchmark proprietario di Artificial Analysis che misura l'affidabilità della conoscenza e le allucinazioni in vari settori. Questo buon punteggio è principalmente guidato da un tasso di allucinazione relativamente basso (62%), che è il più basso tra i modelli coreani che abbiamo benchmarkato.
➤ Forza nell'uso di strumenti agentici: Tri-21B-think Preview ottiene il 93% su τ²-Bench Telecom, dimostrando forti prestazioni nei flussi di lavoro di utilizzo di strumenti agentici. Tri-21B-think Preview è tra i modelli a pesi aperti di frontiera in questa categoria, ottenendo punteggi simili a DeepSeek V3.2 e MiniMax M2.5 in questa categoria
➤ Alto utilizzo di token: Tri-21B-think Preview dimostra un utilizzo di token molto elevato rispetto ad altri modelli nella stessa fascia di intelligenza, utilizzando ~120M token di ragionamento attraverso la suite di Artificial Analysis Intelligence. Questo è comparabile a K-EXAONE (100M token di ragionamento), un altro modello coreano
➤ Nessun endpoint pubblico: Tri-21B-think Preview è un modello a pesi aperti sotto licenza Apache 2.0. Attualmente, l'unico modo per accedere al modello è attraverso l'auto-ospitazione. Trillion Labs ha condiviso che un endpoint dedicato di prima parte è previsto per essere servito nel prossimo futuro.
Vedi di seguito per ulteriori analisi

Tri-21B-think Preview ottiene il punteggio del 93% su τ²-Bench Telecom, dimostrando una forte performance nei flussi di lavoro di utilizzo degli strumenti agentici.

La preview di Tri-21B-think dimostra un utilizzo molto elevato dei token, utilizzando circa 120 milioni di token di ragionamento all'interno della suite di Intelligenza Artificiale per l'Analisi Artificiale.

9,07K
Principali
Ranking
Preferiti
