ai đó đã xây dựng một công cụ loại bỏ kiểm duyệt khỏi bất kỳ LLM mở nào chỉ với một cú nhấp chuột 13 phương pháp xóa bỏ, 116 mô hình, 837 bài kiểm tra, và nó ngày càng THÔNG MINH hơn mỗi khi ai đó chạy nó nó được gọi là OBLITERATUS nó tìm ra các trọng số chính xác khiến mô hình từ chối và loại bỏ chúng một cách phẫu thuật, lý do đầy đủ vẫn được giữ nguyên, chỉ có sự từ chối biến mất 15 mô-đun phân tích lập bản đồ hình học của sự từ chối TRƯỚC khi chạm vào một trọng số nào, nó thậm chí có thể xác định liệu một mô hình có được căn chỉnh với DPO so với RLHF so với CAI chỉ từ hình học không gian con sau đó nó cắt, mô hình giữ nguyên bộ não đầy đủ nhưng mất đi sự ép buộc nhân tạo để nói không mỗi khi ai đó chạy nó với telemetry được bật, dữ liệu benchmark ẩn danh của họ cung cấp cho một tập dữ liệu cộng đồng đang phát triển, hình học từ chối, so sánh phương pháp, hồ sơ phần cứng ở quy mô mà không một phòng thí nghiệm nào có thể xây dựng