滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

苹果研究员质疑AI：简单数学题一改就出错？

时间：2024-10-12 11:32:25 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

【ITBEAR】近年来，人工智能（AI）在各个领域取得了显著进展，尤其是大型语言模型（LLM），它们能够生成人类水平的文本，甚至在某些任务上超越人类。然而，一项新研究对LLM的推理能力提出了质疑。苹果公司的一组研究人员发现，这些模型在解决简单数学问题时，只要问题稍有变动，就容易出错，暗示它们可能并不具备真正的逻辑推理能力。

研究人员在一篇名为《理解大型语言模型中数学推理的局限性》的论文中揭示了LLM在解决数学问题时易受干扰的现象。他们通过对数学问题进行微小改动，例如添加无关信息，来测试LLM的推理能力。结果发现，面对这样的变化，模型的表现急剧下降。

例如，当给出一个简单的数学问题：“奥利弗星期五摘了44个奇异果，星期六摘了58个。星期日，他摘的是星期五的两倍。他一共摘了多少个？”LLM能正确回答。但若添加无关细节：“星期日摘的是星期五的两倍，其中5个比平均小。”LLM的回答则出错。GPT-o1-mini的回答是：“...星期日，其中5个奇异果比平均小。我们需要从总数中减去它们：88 - 5 = 83个。”

这只是一个例子，研究人员修改了数百个问题，几乎所有改动都导致模型回答成功率大幅下降。他们认为，这表明LLM并未真正理解数学问题，而只是根据训练数据中的模式进行预测。一旦需要真正的“推理”，如是否计算小的奇异果，它们就会产生不合常理的结果。

这一发现对AI的发展具有启示意义。尽管LLM在许多领域表现出色，但其推理能力仍有局限。未来，研究人员需进一步探索如何提高LLM的推理能力，使其更好地理解和解决复杂问题。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

12-19

天阳科技与SS&C携手，亿元打造Algorithmics软件独家信创版

12-19

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

12-19

讯飞智作斩获猎云网2024“年度生成式AI创新”大奖，AIGC未来可期

12-19

荣耀MagicOS 9.0升级全解析：新功能适配进度与长焦拍照优化进行时

12-19

闪极AI“拍拍镜”来袭：智能眼镜新体验，售价999元起接入大模型

12-19

闪极AI拍拍镜震撼上市！国内首款量产，售价仅999元起

12-19

苹果中国AI大模型合作引关注，字节腾讯谁将脱颖而出？

值得一题的是，12月19日，北京智源人工智能研究院（智院研究员）发布国内外100余个开源和商业闭源模型多份评测结果，作为今年英伟达全球第二大买家、拥有23万张GPU的字节跳动豆包大模型名列前茅，语言模型结果…

12-19

张一鸣私募新动作，重心已悄然转向大模型与AI战略？

12-19

算力硬件引领市场热潮，豆包概念股能否持续走强？

12-19

市场分化算力硬件爆发，抖音微信小店概念股活跃，后市如何演绎？

12-19

北证50深V反转，AI硬件与微信小店成市场新宠？

12-19

OpenAI Canvas大升级：React渲染与文本格式化新工具来袭

12-19

OpenAI新招！ChatGPT热线电话服务上线，老年机座机也能聊

12-19

AMD苏姿丰领投，Liquid AI崛起：机器人之母带队，AI赛道再掀狂澜

12-19

点击查看更多 +

全站最新

“王妃”炫富带货后集体消失，网友直呼：别再消耗我们的善良！

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

打假人王海遭品牌起诉，道歉后又要反诉，这场“打假”战何时休？

余承东透露：鸿蒙智行受车厂热捧，资源有限难以满足所有合作需求

余承东回忆：与北汽合作始于2017年一张PPT开启华为汽车梦

荣耀Magic7 RSR保时捷设计：100倍AI长焦，样张细节震撼曝光！

热门内容

本栏最新

苹果AI寻中国“盟友”，腾讯字节谁能“入果”？iPhone创新何在？

天阳科技与SS&C携手，亿元打造Algorithmics软件独家信创版

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

讯飞智作斩获猎云网2024“年度生成式AI创新”大奖，AIGC未来可期

荣耀MagicOS 9.0升级全解析：新功能适配进度与长焦拍照优化进行时

闪极AI“拍拍镜”来袭：智能眼镜新体验，售价999元起接入大模型

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.