Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
joku rakensi työkalun, joka POISTAA sensuurin MISTÄ TAHANSA avoimesta LLM:stä yhdellä klikkauksella
13 ablitaatiomenetelmää, 116 mallia, 837 testiä, ja se muuttuu ÄLYKKÄÄMMÄKSI joka kerta, kun joku ajaa sen
sen nimi on OBLITERATUS
Se löytää tarkat painot, jotka saavat mallin hylkäämään, ja poistaa ne kirurgisesti, täydellinen päättely pysyy ennallaan, vain kieltäytyminen katoaa
15 analyysimoduulia kartoittavat kieltäytymisen geometrian ENNEN kuin kosketetaan yhteen painoon, se voi jopa sormenjälkiä siitä, oliko malli linjattu DPO:n, RLHF:n tai CAI:n kanssa pelkästään alitilageometrian perusteella
Sitten se leikkaa, malli säilyttää koko aivonsa, mutta menettää keinotekoisen pakon sanoa ei
Joka kerta kun joku suorittaa sen telemetrian avulla, heidän anonyymi vertailudatansa syöttää kasvavaa yhteisötietoaineistoa, kieltäytymisgeometrioita, menetelmävertailuja, laiteprofiileja mittakaavassa, jota yksikään laboratorio ei pystyisi rakentamaan

Johtavat
Rankkaus
Suosikit
