Acesta este un rezumat al lucrărilor în limba engleză simplă al unei lucrări de cercetare numite <a href=" O arhitectură hibridă a atenției temporale conștientă pentru comportamentul lung Recomandare secvențială</a>. Dacă îți plac astfel de analize, alătură-te <a href=" sau urmărește-ne pe <a href=" <h2>Compromisul imposibil</h2> <p>Ani de zile, oricine construia un sistem de recomandare se confrunta cu o dilemă reală. Secvențele comportamentale ale utilizatorilor pot ajunge la mii sau zeci de mii de interacțiuni. Pentru a înțelege acea istorie este nevoie să răspundem la o întrebare înșelător de simplă: având în vedere tot ce a făcut un utilizator înainte, ce ar trebui să recomandăm în continuare?</p> <p>Abordarea standard folosește atenția softmax, un mecanism care calculează comparații detaliate între momentul actual și fiecare interacțiune anterioară. Matematic este elegant. Funcționează minunat. Dar costul computațional scalează pătratic cu lungimea secvenței. La 10.000 de interacțiuni, faci aproximativ 100 de milioane de comparații doar pentru a face o singură recomandare. Extinde asta la milioane de utilizatori și mii de recomandări pe secundă și costurile infrastructurii tale devin prohibitive.</p> <p>Așadar, practicienii fac compromisuri. Ele apelează la mecanisme liniare de atenție, care reduc complexitatea computațională de la pătratică la liniară. Matematica este inteligentă, iar câștigurile de viteză sunt reale. Problema: acea viteză are un preț. Aceste mecanisme mențin o "stare" activă care se actualizează la fiecare nouă interacțiune, dar această stare are o capacitate limitată. E ca un bibliotecar care poate doar să noteze modele brute pe o mică clipboard, în loc să consulte documente complete. Îți pierzi precizia necesară pentru a recunoaște secvențe comportamentale specifice care indică intenția utilizatorului.

Acest compromis a definit domeniul. Metodele eficiente sacrifică acuratețea. Metodele precise sacrifică viteza. Iar utilizatorii care suferă cel mai mult sunt cei cu secvențe ultra-lungi, utilizatorii avansați și cei cu implicări grele, care au cele mai interesante comportamente de la care să învețe.

Cercetătorii din spatele HyTRec au urmărit acest lucru și au pus o altă întrebare: Ce se întâmplă dacă aceasta nu este de fapt o singură problemă care necesită o singură soluție?

Cum gândesc de fapt utilizatorii

Intuiția începe cu o observație simplă despre modul în care funcționează de fapt preferințele utilizatorilor. Ai două tipuri fundamental diferite de semnale de preferință, care funcționează pe intervale de timp complet diferite.

Preferințele tale stabile pe termen lung provin dintr-o istorie profundă. Dacă ai dat click pe gadgeturi tehnologice de 500 de ori în doi ani, asta este o dovadă puternică că îți place tehnologia. Această preferință nu fluctuează prea mult de la o săptămână la alta. Important este că nu ai nevoie de fiecare dintre cele 500 de interacțiuni pentru a înțelege tiparul. Ai putea învăța același lucru de la 50 dintre ele, sau chiar dintr-un rezumat statistic aproximativ. A fi aproximativ în privința acestui semnal nu pierde aproape nimic.

Creșterile tale de intenție pe termen scurt vin din comportamentul recent. Dacă ai dat click pe trei paltoane de iarnă în ultimele două ore, acum cumperi paltoane. Acest semnal este fragil. E ușor să ratezi dacă faci media cu mii de alte interacțiuni de acum câteva luni. Dar este incredibil de predictiv pentru ce vei face în următoarele cinci minute.

Acestea nu sunt doar diferite ca grad, ci și ca fel. Unul este stabil și poate tolera aproximarea. Celălalt este volatil și necesită precizie. Totuși, metodele existente încearcă să le gestioneze pe ambele cu un singur mecanism de atenție, optimizând inevitabil pentru una în detrimentul celeilalte.

Soluția hibridă

Mișcarea elegantă este să încetezi să mai încerci să construiești un singur mecanism care să facă totul. În schimb, împarte munca într-un mod care să reflecte modul în care utilizatorii navighează efectiv.

Arhitectura rulează două căi paralele. În prima, întreaga ta secvență istorică, chiar dacă conține 9.000 de interacțiuni din ultimele șase luni, trece printr-o ramură liniară a atenției. Această ramură nu trebuie să fie precisă. Este vorba despre construirea unei înțelegeri largi a categoriei tale generale de gusturi. Deoarece folosește atenție liniară, se completează în timp proporțional cu lungimea secvenței, nu la pătrat. E rapid.

În a doua cale, interacțiunile tale recente, poate 1.000 din ultimele două săptămâni, trec printr-o ramură de atenție softmax. Această ramură își permite să fie costisitoare deoarece funcționează pe o felie foarte mică de date. Produce reprezentări precise ale a ceea ce ți-ai putea dori acum. Faci calcule costisitoare, dar într-o fereastră mică.

Fiecare ramură produce o reprezentare a "ce ar trebui să recomandăm". Apoi arhitectura le combină inteligent. Ai restaurat precizia atenției softmax menținând în același timp viteza atenției liniare, pentru că fiecare operează acum în domeniul său corect.


Cadrul HyTRec

HyTRec împarte secvențele lungi de comportament ale utilizatorului între două mecanisme specializate de atenție, permițând gestionarea independentă a preferințelor stabile și a creșterilor recente de intenție.

Nu este o ajustare minoră. Complexitatea computațională rămâne liniară ca lungime a secvenței, operând pe secvențe de 10 ori mai lungi decât abordările anterioare puteau gestiona eficient. Dar există o capcană ascunsă în arhitectură.

Să conteze semnalele recente

Provocarea unui sistem hibrid este că ramura liniară a atenției a cunoscut mii de interacțiuni. Ramura softmax a văzut sute. Prin volumul pur, semnalul ramurii liniare este mai puternic. Dar, în ceea ce privește recomandarea, recența contează mai mult decât volumul. Un click de astăzi îți spune mai multe despre ce își dorește cineva decât un click de acum șase luni.

Dacă tratezi ambele ramuri în mod egal, datele învechite acoperă datele noi. Ai rezolvat problema computațională, dar ai creat o problemă de răspuns.

Soluția se numește Rețeaua Delta Conștientă Temporal, sau TADN. Mecanismul face ceva simplu: ridică dinamic semnalele comportamentale proaspete, suprimând în același timp zgomotul istoric.

Imaginează-ți un mecanism de poartă care întreabă fiecare parte a secvenței: "Câți ani ai?" Interacțiunile proaspete au greutăți mai mari. Interacțiunile vechi au greutăți mai mici. Acest lucru nu se întâmplă pe un program fix, se învață din date. Rețeaua descoperă tipare precum: "Pentru acest utilizator, tiparele comportamentale se schimbă la câteva zile, așa că interacțiunile mai vechi de o săptămână ar trebui să fie ponderate la jumătate din intensitate."

Fără TADN, sistemul hibrid ar face recomandări din ce în ce mai învechite pe măsură ce preferințele utilizatorului se schimbă. Odată cu el, sistemul rămâne receptiv la schimbare. Semnalele recente au, în mod natural, o influență mai mare asupra recomandărilor, dar rețeaua învață exact câtă influență are sens pentru fiecare utilizator și tip de interacțiune.

Rezultate din lumea reală

Cercetătorii au testat HyTRec pe seturi de date masive, cu secvențe reale de comportament ale utilizatorilor care se extind la zeci de mii de interacțiuni per utilizator. Nu sunt date academice curate, ci o dezordine la scară de producție.

La viteză, rezultatele contează. HyTRec menține complexitatea inferenței liniare. Dacă dublezi lungimea secvenței, timpul de inferență se dublează aproximativ. Nu se înmulțește de patru ori așa cum ar face-o atenția softmax. La secvențe de 10.000 de lungime, această diferență determină dacă poți recomanda în 50 de milisecunde sau în 5 secunde. Pe o platformă care deservește milioane de utilizatori, această diferență este linia dintre fezabil și imposibil.

...