DApp Store | Web3 Hub for hendelser og spill

Populære emner

Jeg legger merke til at på grunn av (tror jeg?) mye benchmarkmaxxing på langsiktige oppgaver, blir LLM-er litt for agentiske som standard, litt over mitt gjennomsnittlige brukstilfelle. For eksempel i koding har modellene nå en tendens til å resonnere i ganske lang tid, de har en tilbøyelighet til å begynne å liste opp og gripe filer over hele repoen, de gjør gjentatte nettsøk, de overanalyserer og overtenker små sjeldne kanttilfeller selv i kode som er bevisst ufullstendig og under aktiv utvikling, og kommer ofte tilbake ~minutter senere selv for enkle spørringer. Dette kan være fornuftig for langvarige oppgaver, men det passer mindre godt for mer "in the loop" iterert utvikling som jeg fortsatt gjør mye av, eller hvis jeg bare leter etter en rask stikkprøve før jeg kjører et skript, i tilfelle jeg fikk feil indeksering eller gjorde en dum feil. Så jeg tar meg selv ganske ofte i å stoppe LLM-ene med variasjoner av "Stopp, du overtenker dette. Se bare på denne ene filen. Ikke bruk verktøy. Ikke overkonstruer" osv. I utgangspunktet når standarden sakte begynner å snike seg inn i "ultrathink" superagentisk modus, føler jeg et behov for det motsatte, og mer generelt gode måter å indikere eller kommunisere intensjoner / innsatser på, fra "bare ta en rask titt" hele veien til "gå av i 30 minutter, kom tilbake når du er helt sikker".

125,78K

Topp

Rangering

Favoritter

Trendende onchain

Trendende på X

Nylig toppfinansiering

Mest lagt merke til