DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Nieuw onderzoek naar het verbeteren van zelfreflectie in taalagenten. Een kernprobleem met zelfreflectie van agenten is dat modellen de neiging hebben om repetitieve reflecties te genereren die ruis in plaats van signaal toevoegen, wat de algehele redeneervaardigheid schaadt. Het introduceert ParamMem, een parametrische geheugeneenheid die cross-sample reflectiepatronen rechtstreeks in modelparameters encodeert, en vervolgens temperatuurgecontroleerde sampling gebruikt om diverse reflecties te genereren tijdens de inferentietijd. ParamMem toont consistente verbeteringen ten opzichte van SOTA-baselines op het gebied van codegeneratie, wiskundig redeneren en multi-hop QA. Het maakt ook zwakke naar sterke overdracht en zelfverbetering mogelijk zonder een sterker extern model nodig te hebben, waardoor het een praktische upgrade is voor agentische pipelines. Paper: Leer effectieve AI-agenten te bouwen in onze academie:

Boven

Positie

Favorieten