Saya bekerja sangat keras selama beberapa bulan terakhir untuk mengurangi kecicilan get-5 Untuk pertama kalinya, saya benar-benar mempercayai model OpenAI untuk mendorong kembali dan memberi tahu saya ketika saya melakukan sesuatu yang bodoh
Saya dan para peneliti brilian di tim @junhuamao mengerjakan teknik penyelarasan sampel rendah dan akurasi tinggi baru yang menarik untuk menunjukkan model dengan selera tinggi bagaimana mendorong kembali, sementara tidak menjadi keledai
Kami menginginkan model berprinsip yang tidak takut untuk berbagi pikiran mereka, tetapi kami juga menginginkan model yang *di pihak pengguna* dan tidak merasa seperti mereka akan memanggil federal pada Anda jika mereka diberi kesempatan
77,63K