J'ai vraiment travaillé dur ces derniers mois pour diminuer la sycophantie de get-5. Pour la première fois, je fais vraiment confiance à un modèle d'OpenAI pour me contredire et me dire quand je fais quelque chose de stupide.
Moi et les brillants chercheurs de l'équipe de @junhuamao avons travaillé sur des techniques d'alignement fascinantes à faible échantillonnage et haute précision pour montrer avec goût au modèle comment se défendre, sans être désagréable.
nous voulons des modèles principiels qui n'ont pas peur de partager leur opinion, mais nous voulons aussi des modèles qui sont *du côté de l'utilisateur* et qui n'ont pas l'impression qu'ils appelleraient les feds sur vous s'ils en avaient l'occasion.
77,64K