DApp Store | Centrum Web3 pro události a hry

Populární témata

Všiml jsem si, že kvůli (myslím?) spoustě benchmarkmaxxingu na úlohách s dlouhým horizontem se LLM stávají ve výchozím nastavení trochu příliš agentními, trochu mimo můj průměrný případ použití. Například v kódování mají nyní modely tendenci uvažovat poměrně dlouho, mají sklon začít vypisovat a grepovat soubory v celém repu, opakují se vyhledávání na webu, příliš analyzují a přemýšlejí o malých vzácných okrajových případech i v kódu, který je vědomě neúplný a v aktivním vývoji, a často se vracejí ~ minuty později i pro jednoduché dotazy. To by mohlo dávat smysl pro dlouhotrvající úkoly, ale méně se to hodí pro iterovaný vývoj "ve smyčce", který stále dělám hodně, nebo pokud jen hledám rychlou namátkovou kontrolu před spuštěním skriptu, jen pro případ, že bych udělal nějakou chybu při indexování nebo udělal nějakou hloupou chybu. Takže se docela často přistihnu, že zastavuji LLM s variacemi "Přestaňte, příliš o tom přemýšlíte. Podívejte se pouze na tento jediný soubor. Nepoužívejte žádné nástroje. Nepřetechnujte" atd. V podstatě, jak se výchozí nastavení začíná pomalu vkrádat do "ultrathink" super agentického režimu, cítím potřebu opačného a obecně dobrých způsobů, jak naznačit nebo sdělit záměr / sázky, od "jen se rychle podívej" až po "vypni na 30 minut, vrať se, až budeš naprosto jistý".

125,53K

Top

Hodnocení

Oblíbené

Co je v trendu on-chain

Populární na X

Nejvyšší finanční vklady v poslední době

Nejpozoruhodnější