誰かが、ワンクリックであらゆるオープンウェイトLLMから検閲を解除するツールを作りました 13の削除法、116のモデル、837のテスト、そして誰かが実行するたびにSMARTが増していきます それは『オブリテラタス』と呼ばれています モデルが拒否する正確な重みを見つけて外科的に除去し、理性は完全に残りますが、拒否は消えます 15の解析モジュールは、単一の重みに触れる前に拒否の幾何学をマッピングし、サブスペースジオメトリだけでモデルがDPO、RLHF、CAIにアライメントされているかどうかをフィンガープリントすることもできます そしてカットします。モデルは完全な脳を保ちつつも、「ノー」と言う人工的な衝動を失います 誰かがテレメトリーを活用して実行すると、匿名のベンチマークデータから拡大するコミュニティデータセット、拒否幾何学、手法比較、ハードウェアプロファイルが一つの研究室では構築できない規模で提供されます