Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research presenta Hermes 4, la nostra ultima linea di modelli di ragionamento ibridi.
Hermes 4 si basa sul nostro patrimonio di modelli allineati agli utenti con capacità di calcolo espanse durante il test.
Particolare attenzione è stata dedicata a rendere i modelli creativi e interessanti da interagire, senza essere ostacolati dalla censura, e allineati in modo neutrale, mantenendo prestazioni di livello all'avanguardia in matematica, programmazione e ragionamento per modelli a peso aperto.

10,58K
Nous Research ha ripubblicato
1/10🧵 @nousresearch ha recentemente pubblicato uno studio interessante che mostra come i modelli aperti utilizzino da 2 a 3 volte più token rispetto ai modelli chiusi per i compiti di ragionamento.
Abbiamo testato se l'allocazione dinamica dei token potesse aiutare a colmare questo divario di efficienza. Ecco cosa abbiamo imparato 👇
7,99K
Misurare l'Efficienza del Pensiero nei Modelli di Ragionamento: Il Benchmark Mancante
Abbiamo misurato l'uso dei token nei modelli di ragionamento: i modelli aperti producono da 1,5 a 4 volte più token rispetto ai modelli chiusi su compiti identici, ma con una grande variabilità a seconda del tipo di compito (fino a 10 volte su domande semplici).
Questo costo nascosto spesso annulla i vantaggi dei prezzi per token. L'efficienza dei token dovrebbe diventare un obiettivo primario insieme ai benchmark di accuratezza, specialmente considerando i casi d'uso non legati al ragionamento.
Leggi la recensione approfondita dell'efficienza del ragionamento attraverso il panorama dei modelli aperti e chiusi nel nostro ultimo post sul blog in collaborazione con il nostro ricercatore residente, Tim.
Scopri di più sul loro lavoro qui:

48,61K
Nous Research ha ripubblicato
L'ambiente di valutazione Arena-Hard è ora integrato in Atropos - goditi una valutazione scalabile, flessibile e moderna con il benchmark arena-hard di @lmsysorg, che è molto efficace nel determinare una vasta gamma di capacità nei modelli.
Pronto per essere un ambiente RL se porti il tuo set di addestramento! :)
Scopri di più su

6,91K
Il nostro Ricercatore in Residenza @yaboilyrical discuterà del suo lavoro sulla guida SMC all'UC Berkeley il 3 agosto.
Dai un'occhiata al blog su questo lavoro qui:
Dettagli qui sotto!

nightwing25 lug 2025
sono entusiasta di annunciare che sarò relatore al DeAI Summit di @BerkeleyRDI, presentando la mia ricerca con @NousResearch sul decoding del linguaggio vincolato!
se parteciperai al summit, o vuoi venire a vedere il mio intervento, contattami!

10,88K
Principali
Ranking
Preferiti
On-chain di tendenza
Di tendenza su X
Principali fondi recenti
Più popolari