Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🧠 Resonnement som grensesnitt for lagring med lang kontekst
I vårt forrige innlegg (AMemGym) understreket vi hvor viktig interaktiv evaluering er. Nå anvender vi det på de nyeste "perfekte" langkontekstmodellene som GPT-5.2.
▪️ Det store spørsmålet: Har vi løst oppgaver med lang horisont?
▪️ Svaret: Ikke helt. Det handler om avveiningen mellom resonnement og beregning.
Et dypdykk i hukommelsesmekanikken for naturlig langkontekst 👇
1. Ikke bare ryggradsmodellen
GPT-5.2 viser enorme gevinster på MRCR-referansene. Men da vi demonterte variablene, fant vi at en stor del av gevinsten kommer fra høy resonnementinnsats, ikke bare ryggradsmodellen.
2. Minneligningen
En ny måte å se resonnementkostnaden for minnehenting på:
[ Minimal resonneringsinnsats ∝ 1 / Minnekvalitet ]
Resonnering fungerer som en adaptiv søkemotor. Den betaler beregningskostnaden for å «binde på nytt» informasjon som ikke ble lagret effektivt.
3. AMemGym-resultater
Vi testet noen flaggskipmodeller på AMemGym (vår ICLR'26 interaktive minnebenchmark) for å evaluere realistisk langsiktig ytelse.
🔹 Resonnering er en multiplikator: Høy resonneringsinnsats er avgjørende for dynamiske, høyordens assosiasjoner.
🔹 Personalisering er vanskelig: Selv flaggskipmodeller sliter med å opprettholde brukerstatus over lang tid.
🔹 Åpne vekter: GLM-4.7 viser stort potensial og kan måle seg med lukkede modeller.
4. Fremtiden (Beyond Simulation): Toveis dører x testtidsskalering
Optimalisering av minnet i naturen er mulig ved å kombinere «ikke-tapende» minnepersistens med adaptiv testtidsberegning. Ved å bruke mye datakraft på å verifisere logikk og hente dype data, kan modeller/agenter generere selvkontrollert tilbakemelding for å forbedre minnestrukturer. Dette gjør kostbar resonnering i dag om til effektive kognitive snarveier for morgendagen.
📄 Full analyse: ...



Topp
Rangering
Favoritter
