滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Meta携手高校，ExploreToM能否为大语言模型解锁“心智理论”新篇章？

时间：2024-12-20 13:17:19 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

meta公司近期宣布了一项重大科研合作，携手学术界的佼佼者——华盛顿大学与卡内基梅隆大学，共同推出了一个名为ExploreToM的创新框架。这一合作项目的核心目标，是提升大型语言模型（LLM）在心智理论（Theory of Mind，简称ToM）方面的能力。

心智理论，作为人类社会智能的关键组成部分，使我们能够洞悉他人的想法、意图和信念。这种深刻的认知能力，是有效沟通与协作的基石，支撑着我们进行复杂的社交互动。然而，当前的大型语言模型在ToM方面仍显不足，这成为了实现AI与人类无缝互动的一大障碍。

现有的基准测试方法，往往因缺乏足够的复杂性和多样性，而高估了模型的实际能力。这些测试大多基于预设的简单场景，无法复现人类在进行心理状态推断时所采用的复杂推理过程。因此，meta及其合作伙伴决定通过ExploreToM框架，来打破这一瓶颈。

ExploreToM框架的核心优势，在于其能够生成多样化且可扩展的对抗性数据集。这一创新方法，不仅揭示了当前模型的局限性，还展现了高质量训练数据在弥补这些差距方面的巨大潜力。在数据集构建方面，ExploreToM采用了A*搜索算法和特定领域语言，生成了一系列高难度的测试场景，这些场景模拟了复杂的社会情境，挑战着LLM的认知极限。

与现有的基准测试相比，ExploreToM通过创建对抗性的故事场景，旨在揭示LLM在ToM推理中的盲点和不足之处。这一做法，不仅有助于更准确地评估模型的能力，还为后续的改进提供了明确的方向。

ExploreToM框架还引入了一项创新机制——非对称信念更新。这一机制能够模拟不同角色对同一情况持有不同观点的复杂社交互动，从而进一步提升了模型的ToM能力。在实验中，研究人员发现，主流模型如GPT-4o和Llama-3.1-70B，在ExploreToM数据集上的表现并不理想，准确率分别仅为9%和0%。这一结果，再次凸显了现有LLM在处理复杂ToM推理方面的不足。

然而，令人鼓舞的是，当在ExploreToM数据集上进行微调后，这些模型在经典的ToMi基准测试中的准确率有了显著提升，高达27个百分点。这一成果，不仅证明了ExploreToM框架的有效性，也为未来AI在ToM能力上的进一步突破奠定了坚实基础。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

英特尔放弃x86S计划，但仍坚守x86生态创新与合作之路

12-20

华擎英特尔锐炫B570显卡海外开售：10GB显存，售价约1600元

12-20

《超凡蜘蛛侠》新系列来袭，彼得·帕克将迎全新挑战！

12-20

周鸿祎谈成功哲学：讨好型人格，如何在信息洪流中错失财富机遇？

12月19日，知名互联网企业家周鸿祎发表了对个人成功和财富积累的独到见解。他强调，讨好型人格的人在当今信息过载的时代难以赚大钱，原因在于他们往往忽视了打造自己独特的价值和稀缺资源。周鸿祎认为，注意力是现代社…

12-20

京东黄金水饺来袭！集齐生肖金币，赢取30万“狗头金”大奖

12-20

小米蓝牙音箱Mini新色发布，勃艮第红迎新年，到手仅需199元！

12-20

小红书集中封号风波，违规账号面临永久封禁？

12-20

土巴兔生态大会启航“星辰计划”，AI+家装引领行业变革新篇章

12-20

《超凡蜘蛛侠》2025年重启新篇章，彼得·帕克迎来未知挑战！

12-20

迪士尼“宝藏号”游轮启航在即，沉浸式体验带你领略梦幻之旅！

12-20

私家车变“顺风车”频繁接单出事故，保险公司拒赔，法院如何判？

12-20

迪士尼新版《白雪公主》预告遭冷遇，网友直呼“暴雪公主”引热议

12-20

小米蓝牙音箱Mini新色上市！勃艮第红特别版仅售199元

12-20

圣诞Citywalk新宠！乐跃瓶保温佳，温暖伴你每一步

12-20

品牌短剧未来已来：如何平衡内容与营销，提升用户心智？

12-20

点击查看更多 +

全站最新

上海车展主办权争夺战，中国贸促会汽车分会与上海贸促会法庭相见

理想汽车郎咸朋：自动驾驶新赛点，AI能力成核心竞争力

李想回归！理想汽车2024 AI Talk即将启幕，连续三晚深度对话

DOTA2重拳出击，6W5账号遭封禁，高分段演员与炸鱼行为何时休？

《血源诅咒》PC版迎来视觉升级，0.8版MOD打造细腻逼真新体验

极越开除公关负责人后，徐继业仍留群发问：为何我还在？

热门内容

本栏最新

英特尔放弃x86S计划，但仍坚守x86生态创新与合作之路

华擎英特尔锐炫B570显卡海外开售：10GB显存，售价约1600元

《超凡蜘蛛侠》新系列来袭，彼得·帕克将迎全新挑战！

京东黄金水饺来袭！集齐生肖金币，赢取30万“狗头金”大奖

小米蓝牙音箱Mini新色发布，勃艮第红迎新年，到手仅需199元！

小红书集中封号风波，违规账号面临永久封禁？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.