Jag har jobbat väldigt hårt under de senaste månaderna på att minska få-5-smicker För första gången litar jag verkligen på att en OpenAI-modell slår tillbaka och säger till mig när jag gör något dumt
Jag och de briljanta forskarna i @junhuamao:s team arbetade med fascinerande nya tekniker för justering med lågt urval och hög noggrannhet för att smakfullt visa modellen hur man trycker tillbaka, samtidigt som den inte är en åsna
Vi vill ha principfasta modeller som inte är rädda för att dela med sig av sina åsikter, men vi vill också ha modeller som är på användarens sida och som inte känner att de skulle ringa FBI om de fick chansen
64,29K