He trabajado muy duro en los últimos meses para disminuir la adulación en get-5. Por primera vez, realmente confío en un modelo de OpenAI para que me desafíe y me diga cuando estoy haciendo algo estúpido.
Yo y los brillantes investigadores del equipo de @junhuamao trabajamos en fascinantes nuevas técnicas de alineación de bajo muestreo y alta precisión para mostrar de manera elegante al modelo cómo resistir, sin ser un idiota.
queremos modelos con principios que no tengan miedo de expresar su opinión, pero también queremos modelos que estén *del lado del usuario* y que no sientan que llamarían a la policía si tuvieran la oportunidad.
77,63K