當一個大型語言模型報告它修復了41個失敗測試中的37個(提高了90%)並詢問接下來該做什麼時,這種滿足感和深深的奇怪感是存在的,並且它正確地理解了「繼續前進!」
18.79K