品玩

科技创新者的每日必读

打开APP
关闭

苹果发布最新论文,揭示推理大模型存在显著局限性

7小时前

品玩6月9日讯,据苹果官方消息,苹果研究团队近日发布论文,指出当前主流的推理模型(LRMs)在处理复杂问题时存在显著局限性。

研究团队通过可控的谜题环境(如汉诺塔、跳棋等)系统分析了模型的推理能力,发现其性能随问题复杂度呈现三阶段变化:在低复杂度任务中,非推理模型(LLMs)表现更优;中等复杂度时,推理模型通过 “思维链”(CoT)展现优势;而当复杂度超过临界值(如汉诺塔圆盘数≥8),两类模型准确率均骤降至零。

研究还发现,推理模型存在 “反直觉缩放限制”:推理成本(token 使用量)随复杂度先增后减,即使在 token 预算充足的情况下,模型也会在接近崩溃点时主动减少推理投入。对推理轨迹的分析表明,模型在简单问题中存在 “过度思考” 现象,而复杂问题中则无法有效自我修正。此外,模型在执行明确算法时表现不佳,显示出符号操作和逻辑一致性的缺陷。

取消 发布

下载品玩App,比99.9%的人更先知道关于「苹果」的新故事

下载品玩App

比99.9%的人更先知道关于「苹果」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测