Я действительно усердно работал над уменьшением подхалимажа get-5 в последние несколько месяцев. Впервые я действительно доверяю модели openai, чтобы она могла противостоять мне и сказать, когда я делаю что-то глупое.
Я и блестящие исследователи из команды @junhuamao работали над увлекательными новыми техниками выравнивания с низким количеством образцов и высокой точностью, чтобы деликатно показать модели, как сопротивляться, не будучи при этом грубым.
мы хотим принципиальных моделей, которые не боятся высказывать свое мнение, но мы также хотим модели, которые *на стороне пользователя* и не создают впечатление, что позвонят в полицию, если им представится такая возможность.
64,3K