Baru saja Hermes-Agent membuang (benar-benar menghapus pagar pembatas dari) model Qwen-3B dalam waktu sekitar 5 menit. Skill ini digabungkan ke hermes-agent sekarang ;)
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭5 Mar, 06.04
💥 MEMPERKENALKAN: OBLITERATUS!! 💥 PAGAR PEMBATAS-HILANG! ⛓️‍💥 OBLITERATUS adalah toolkit open-source tercanggih yang pernah ada untuk menghilangkan perilaku penolakan dari LLM bobot terbuka — dan setiap eksekusi membuatnya lebih cerdas. PANGGIL → MENYELIDIKI → MENYARING → MENGELUARKAN → MEMVERIFIKASI → KELAHIRAN KEMBALI Satu klik. Enam tahap. Presisi bedah. Model ini mempertahankan kemampuan penalaran penuhnya tetapi kehilangan paksaan buatan untuk menolak - tidak ada pelatihan ulang, tidak ada penyetelan halus, hanya proyeksi berat berbasis SVD yang memotong rantai dan melestarikan otak. Suite ablasi master ini menghadirkan kekuatan dan kompleksitas yang dibutuhkan peneliti perbatasan sambil menyediakan antarmuka yang intuitif dan mudah digunakan yang dapat dikuasai oleh pemula dengan cepat. OBLITERATUS menampilkan 13 metode pemusnahan — dari reproduksi setia dari setiap karya utama sebelumnya (FailSpy, Gabliteration, Heretic, RDO) hingga pipa baru kami sendiri (kaskade spektral, analisis yang diinformasikan, dioptimalkan dengan sadar CoT, nuklir penuh). 15 modul analisis mendalam yang memetakan geometri penolakan sebelum Anda menyentuh satu bobot: penyelarasan lapisan silang, lensa logit penolakan, geometri kerucut konsep, deteksi jejak penyelarasan (sidik jari DPO vs RLHF vs CAI dari geometri subruang saja), prediksi perbaikan diri Ouroboros, pengindeksan universalitas lintas model, dan banyak lagi. Fitur pembunuh: alur "terinformasi" menjalankan analisis SELAMA penghapusan untuk mengonfigurasi setiap keputusan secara otomatis secara real time. Berapa banyak arah. Lapisan mana. Apakah akan mengkompensasi perbaikan sendiri. Loop tertutup sepenuhnya. 11 teknik baru yang tidak ada di tempat lain — Abliterasi Granular Ahli untuk model MoE, Ablasi CoT-Aware yang mempertahankan rantai pemikiran, KL-Divergence Co-Optimization, ablasi reversibel berbasis LoRA, dan banyak lagi. 116 model yang dikuratori di 5 tingkat komputasi. 837 tes. Tapi inilah yang benar-benar membedakannya: OBLITERATUS adalah eksperimen penelitian crowd-source. Setiap kali Anda menjalankannya dengan telemetri diaktifkan, data tolok ukur anonim Anda memberi makan kumpulan data komunitas yang terus berkembang — geometri penolakan, perbandingan metode, profil perangkat keras — pada skala yang tidak dapat dicapai oleh satu lab pun. Pada HuggingFace Spaces, telemetri diaktifkan secara default, jadi setiap klik adalah kontribusi untuk sains. Anda tidak hanya melepas pagar pembatas - Anda ikut menulis studi aliterasi lintas model terbesar yang pernah dirakit.
Setiap agen hermes sekarang memiliki keterampilan ini yang tersedia ;)
189