Pracowałem naprawdę ciężko przez ostatnie kilka miesięcy, aby zmniejszyć sycofantyzm get-5. Po raz pierwszy naprawdę ufam modelowi openai, który potrafi się sprzeciwić i powiedzieć mi, kiedy robię coś głupiego.
Ja oraz wspaniali badacze z zespołu @junhuamao pracowaliśmy nad fascynującymi nowymi technikami dopasowania o niskiej próbce i wysokiej dokładności, aby w gustowny sposób pokazać modelowi, jak się bronić, nie będąc przy tym niegrzecznym.
chcemy modeli, które mają zasady i nie boją się wyrażać swojego zdania, ale chcemy też modeli, które są *po stronie użytkownika* i nie sprawiają wrażenia, że zadzwoniłyby na policję, gdyby miały taką możliwość.
77,64K