Чи є міркування ланцюжка думок ЛМ міражем? ... Наші результати показують, що міркування CoT є крихким міражем, який зникає, коли його виштовхують за межі тренувального розподілу. Ця робота пропонує глибше розуміння того, чому і коли міркування CoT зазнають невдачі, наголошуючи на поточній проблемі досягнення справжнього та узагальнюваного міркування. ... Наші результати показують, що міркування CoT ефективно працюють у застосуванні до розподілу або поблизу Дані в розподілі, але стають крихкими і схильними до збоїв навіть при помірних зрушеннях розподілу. У деяких випадках LLM генерують плавні, але логічно непослідовні кроки міркування. Результати свідчать про те, що те, що здається структурованим міркуванням, може бути міражем, що виникає з запам'ятовуваних або інтерпольованих шаблонів у тренувальних даних, а не з логічного висновку. ... У сукупності ці результати свідчать про те, що LLM не є принциповими міркуваннями, а скоріше складними симуляторами тексту, схожого на міркування.
2508.01191v2.pdf
43,97K