DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

🧠 Raționamentul ca interfață pentru stocarea pe context lung În ultima noastră postare (AMemGym), am subliniat cât de importantă este evaluarea interactivă. Acum, îl aplicăm celor mai noi modele "perfecte" de context lung, precum GPT-5.2. ▪️ Marea întrebare: Am rezolvat sarcini pe termen lung? ▪️ Răspunsul: Nu chiar. Este vorba despre compromisul Raționament-Calcul. O scufundare profundă în mecanica memoriei pentru contextul 👇 lung nativ 1. Nu doar modelul Backbone GPT-5.2 arată câștiguri masive la benchmark-urile MRCR. Dar când am descurcat variabilele, am descoperit că o mare parte din acest câștig vine din efort ridicat de raționament, nu doar din modelul de bază al economiei. 2. Ecuația memoriei O nouă modalitate de a privi costul raționamentului pentru recuperarea memoriei: [ Efort minim de raționament ∝ 1 / Calitatea memoriei ] Raționamentul acționează ca un motor de căutare adaptiv. Plătește costul de calcul pentru a "rebinda" informațiile care nu au fost stocate eficient. 3. Rezultatele AMemGym Am testat câteva modele emblematice pe AMemGym (benchmark-ul nostru ICLR'26 pentru memorie interactivă) pentru a evalua performanța realistă pe termen lung. 🔹 Raționamentul este un multiplicator: Efortul ridicat de raționament este esențial pentru asocierile dinamice, de ordin înalt. 🔹 Personalizarea este dificilă: Chiar și modelele de top se luptă să mențină starea utilizatorului pe termen lung. 🔹 Greutăți deschise: GLM-4.7 arată un potențial puternic, rivalizând cu modelele închise. 4. Viitorul (dincolo de simulare): Uși bidirecționale x scalare în timpul testului Optimizarea memoriei în sălbăticie este posibilă combinând persistența memoriei "non-lossy" cu calculul adaptiv în timpul testului. Cheltuind un volum ridicat de calcul pentru a verifica logica și a recupera date profunde, modelele/agenții pot genera feedback auto-supravegheat pentru a rafina structurile de memorie. Acest lucru transformă raționamentul costisitor de astăzi în scurtături cognitive eficiente pentru ziua de mâine. 📄 Analiză completă: ...

Limită superioară

Clasament

Favorite