Am muncit foarte mult în ultimele luni pentru a reduce sicofanția Get-5 Pentru prima dată, am încredere într-un model OpenAI care să-mi spună când fac ceva stupid
Eu și cercetătorii străluciți din echipa lui @junhuamao am lucrat la noi tehnici fascinante de aliniere cu eșantion scăzut și de înaltă precizie pentru a arăta cu bun gust modelului cum să împingă înapoi, fără a fi un măgar
Vrem modele principiale care nu se tem să-și împărtășească părerea, dar vrem și modele care sunt *de partea utilizatorului* și nu simt că i-ar chema pe federali dacă li s-ar da șansa
144