你认为大型语言模型在数学方面很糟糕,因为它们无法可靠地加两个十位数。但你有没有试过请专业数学家加两个十位数?
1.72K