хтось створив інструмент, який ЗНІМАЄ цензуру з БУДЬ-ЯКОЇ відкритої LLM одним кліком 13 методів алітерації, 116 моделей, 837 тестів, і щоразу, коли хтось запускає, все стає РОЗУМНІШИМ вона називається OBLITERATUS Він знаходить саме ті ваги, які змушують модель відмовлятися, і хірургічно їх видаляє, повне міркування залишається недоторканим, але відмова зникає 15 аналітичних модулів відображають геометрію відмови ПЕРЕД торкненням однієї ваги, він навіть може відбити, чи була модель вирівняна з DPO, RLHF чи CAI лише на основі субпросторової геометрії Потім він розрізається, модель зберігає повний мозок, але втрачає штучне бажання казати «ні» Кожного разу, коли хтось запускає його з увімкненою телеметрією, його анонімні бенчмаркові дані подають зростаючий набір даних спільноти, геометрії відмов, порівняння методів, апаратні профілі у масштабі, які жодна лабораторія не могла б створити