Jeg har jobbet veldig hardt de siste månedene med å redusere Get-5-sykofanien For første gang stoler jeg virkelig på at en OpenAI-modell presser tilbake og forteller meg når jeg gjør noe dumt
Jeg og de briljante forskerne i @junhuamao team jobbet med fascinerende nye justeringsteknikker med lav prøve og høy nøyaktighet for å smakfullt vise modellen hvordan man skyver tilbake, uten å være en drittsekk
Vi vil ha prinsippfaste modeller som ikke er redde for å dele tankene sine, men vi vil også ha modeller som er *på brukerens side* og ikke føler at de ville ringt Feds på deg hvis de fikk sjansen
64,28K