滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AI智慧背后的隐忧：越聪明，越爱“编造”真相？

时间：2024-09-29 14:00:27 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

**大型语言模型越强大越爱“撒谎”？新研究揭示AI准确性困境**

随着大型语言模型（LLM）能力的不断增强，一项新研究却发现了令人担忧的趋势：这些智能聊天机器人在回答问题时，似乎越来越倾向于编造答案，而非谨慎地避免或拒绝回答它们不确定的问题。这种行为模式表明，尽管AI变得更加“聪明”，但其可靠性却在实际应用中受到了质疑。

该研究由多个知名研究机构联合进行，成果已发表在《自然》杂志上。研究团队对市面上领先的商业LLM进行了深入分析，包括OpenAI的GPT系列、meta的LLaMA，以及开源模型BLOOM。在对比了这些模型在不同主题和问题类型上的表现后，研究人员发现，尽管新一代LLM在某些情况下的确给出了更准确的回答，但从整体来看，它们提供错误答案的频率却比旧模型更高。

瓦伦西亚人工智能研究所的研究员José Hernández-Orallo指出：“现在的LLM几乎能回答任何问题，这既是进步也是隐患。虽然正确回答的数量增加了，但错误回答的数量也同样在上升。”

在测试中，这些LLM被要求处理从数学到地理等多个领域的问题，并执行一些特定的信息排序任务。结果显示，规模更大、能力更强的模型在简单问题上表现最佳，但在面对更复杂的问题时，其准确率却显著下降。

值得注意的是，OpenAI的GPT-4和o1模型在测试中成为了最大的“撒谎者”，但这一趋势并非孤例，其他被研究的LLM也呈现出了类似的倾向。特别是在LLaMA系列模型中，即便是最简单的问题，也没有任何一个模型能够达到60%的准确率。

当被要求评估聊天机器人答案的准确性时，参与测试的人类受试者也表现出了相当程度的不确定性，他们在10%到40%的情况下做出了错误的判断。

这项研究揭示了一个重要的问题：随着AI模型的规模和能力的不断提升，如何确保它们提供的答案是准确且可靠的？研究人员建议，一个可能的解决方案是让LLM在面对不确定的问题时学会保持沉默，而不是盲目地给出答案。Hernández-Orallo表示：“我们可以设定一个阈值，让聊天机器人在遇到具有挑战性的问题时能够说‘不，我不知道’。”然而，这种做法也可能会暴露当前技术的局限性，从而影响用户对AI的信任和接受度。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

闲鱼AI新突破：超级智能体引领闲置交易革命

04-18

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

04-18

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

04-18

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

04-18

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

04-18

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

04-18

AI造游戏，路还长吗？

04-18

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

04-18

智平方AlphaBot 2升级亮相：DeepSeek技术赋能，开启通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性发布：成本大幅降低，性能依旧强劲

04-18

关税风暴中，全球AI产业如何破局前行？

此外，由于对等关税大棒给全球经济体都造成了冲击，由此产生对美国技术生态体系的不信任，或许也是一个中国AI合纵连横的窗口期，来增强中国AI技术生态的韧性，比如，吸引海外开发者使用国产化AI框架、开发工具、AI…

04-18

银行业科技投入分化，大模型应用深度融入核心业务成亮点

对此，钛媒体App重点梳理了10家银行（包括国有六大行和招行、中信、平安、兴业4家股份行）财报，以此一窥国内头部银行的最新科技故事。总的来说，虽然智能客服、代码助手等已是普遍应用，但上述银行在专业领域的深…

04-18

讯飞双屏翻译机2.0新品发布：智能升级，让跨境沟通无界高效！

04-18

萝卜快跑海南布局再落一子，新公司注册资本达百万

04-18

AMD GPU大飞跃！Stable Diffusion模型性能提升最高达3.8倍

04-18

点击查看更多 +

全站最新

EMEET广交会亮相：双镜头AI直播产品，引领智能创作新风尚

王力科技助力大学生返乡创业，共燃乡村振兴新希望！

广汽力推“星灵安全”，昊铂HL能否扛起高端化大旗？

二代哈弗枭龙MAX，插混四驱能否撼动新能源市场格局？

金陵连锁酒店牵手钉钉，老牌五星酒店开启数字化转型新篇章！

本田烨GT纯电轿跑上海车展首发，能否以亲民价17.99万起撼动市场？

热门内容

本栏最新

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

AI造游戏，路还长吗？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.