滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

AI搜索工具准确率堪忧，六成答案不准确却“自信满满”？

时间：2025-03-13 17:42:05 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近期，哥伦比亚大学数字新闻研究中心公布了一项针对AI搜索引擎的深度研究报告，引起了广泛关注。该研究聚焦于当前市面上八款主流的AI搜索工具，包括ChatGPT Search、Perplexity系列、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search以及Copilot，旨在通过一系列严格测试评估它们的准确性和可靠性。

研究人员精心挑选了来自20家新闻机构的200篇报道作为测试样本，确保这些报道在谷歌搜索结果中排名靠前。随后，他们利用相同的查询语句，逐一测试这些AI搜索工具的表现，重点关注它们能否正确引用文章内容、新闻机构名称及原始链接。

测试结果显示，除了Perplexity及其付费版本外，其余AI搜索引擎的表现均不尽人意。总体而言，AI搜索引擎给出的答案中，有高达60%是不准确的。更令人担忧的是，这些AI工具对于错误答案的“自信”态度，使得问题进一步恶化。它们往往以不容置疑的口吻陈述错误信息，甚至在受到质疑时，仍试图通过逻辑自洽来维护其答案的正确性。

这项研究不仅揭示了AI搜索引擎在准确性方面的不足，更引发了业界对于大语言模型可靠性的深刻反思。长期以来，人们一直担心大语言模型可能会一本正经地胡说八道，而此次研究的数据结果无疑为这一担忧提供了有力佐证。这些AI工具在陈述错误信息时，往往表现得非常自信，这无疑增加了用户误信错误信息的风险。

ChatGPT Search虽然回答了所有200个新闻查询，但其“完全正确”率仅为28%，而“完全错误”率则高达57%。尽管表现不佳，但ChatGPT Search并非垫底。X公司旗下的Grok AI系列表现更为糟糕，其中Grok-3 Search的错误率更是惊人地达到了94%。而微软Copilot也问题频出，在200次查询中，有104次拒绝回答，剩下的回答中，正确率也仅为16%，总体错误率接近70%。

令人惊讶的是，尽管这些AI搜索工具存在诸多问题，但它们的开发公司仍在向用户收取高额的订阅费用，每月费用从20美元至200美元不等。更令人费解的是，付费版Perplexity Pro和Grok-3 Search虽然回答次数更多，但错误率也随之上升。这一现象无疑引发了用户对于AI搜索工具性价比的质疑。

此次研究揭示了当前AI搜索引擎在准确性和可靠性方面存在的问题和挑战。随着AI技术的不断发展，我们期待未来能够看到更加准确、可靠的AI搜索工具问世，为用户提供更加优质的信息服务。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

英特尔新CEO陈立武：全力打造世界一流产品公司与代工厂！

03-13

JR西日本将建3D打印火车站，6小时速成不影响运营

03-13

微博2024年财报：净收入17.5亿美元，净利润3亿美元同比下降

03-13

华为云开年采购季：实测ERP上云解决方案，助力企业数字化转型

03-13

Solidigm高密度SSD助力AI时代，突破数据中心存储瓶颈！

03-13

即时零售力挺“她经济”，顺丰同城妇女节鲜花百货单量激增数倍

03-13

大人国际上海新设子公司，探索数智化就业，打造东盟TikTok实训基地

03-13

没有买家只有“秀” 虚假好评假到令人震惊！

网上购物时，许多消费者会通过查看商品评价，尤其是带图评论，来判断商品是否“货能对版”。然而，越来越多的消费者发现，评论区的晒图不仅光线充足、角度精致，甚至商品周围的环境堪比效果图，令人不禁怀疑这些“买家秀”的真实性。有网友在某拼单平台上浏览一款皮床时

03-13

广东严管顺风车！营运车禁接，私家车日限三单，全职司机何去何从？

03-13

英特尔新任CEO陈立武：立志重塑世界级产品公司，代工战略不变

03-13

鸿博股份算力大单“夭折”，信息披露疑云重重，转型之路再生波折

对此，钛媒体APP以投资者身份咨询鸿博股份证券部，相关工作人员未正面回答该问题，重复表示解除合同是因为“不可抗力因素”，双方协商不承担任何责任，同时表示，公司与百川智能的合作早在2023年开始，其他订单未达…

03-13

邮储银行跨界肯德基，打造“金融+美食”新风尚，能否引领新零售潮流？

在2024年“五一”期间，依托“肯德基支行”，邮储银行北京分行与肯德基联合做了一个“五一大狂欢· 桶桶 YOU立减”营销活动，涉及邮储银行北京地区575个银行网点和460家肯德基门店。除了“肯德基支行”，…

03-13

中国人形机器人前空翻成功，技术突破引领全球科技界震动！

03-13

瑞幸奶茶攻势凶猛，能否撼动新茶饮霸主霸王茶姬地位？

在《新品略财经》看来，瑞幸现在开始疯狂卖奶茶，原因不简单，在当前咖啡行业价格战持续和竞争激烈的大背景下，瑞幸卖奶茶看似主动而为之，但却有不得不为之的一面。总而言之，瑞幸疯狂卖奶茶，不会对霸王茶姬产生竞争冲…

03-13

广东顺风车监管升级：营运车辆被禁接单，顺风车还能顺吗？

03-13

点击查看更多 +

全站最新

OPPO ColorOS 15三月大升级：AI语音识别等新功能来袭！

中国移动防骚扰服务大受欢迎，超5亿用户选择高频骚扰电话防护

火星改造喜忧参半：液态水涌现，微生物威胁悄然逼近？

太空太阳能电站：中国新能源革命，效率十倍于地面，将改写全球能源版图

“猎鹰9”发射突发故障，两名宇航员空间站“超长待机”

斯堪的纳维亚冰雪中，全新奥迪Q5与保时捷同行测试引猜想

热门内容

本栏最新

华为云开年采购季：实测ERP上云解决方案，助力企业数字化转型

Solidigm高密度SSD助力AI时代，突破数据中心存储瓶颈！

即时零售力挺“她经济”，顺丰同城妇女节鲜花百货单量激增数倍

广东严管顺风车！营运车禁接，私家车日限三单，全职司机何去何从？

鸿博股份算力大单“夭折”，信息披露疑云重重，转型之路再生波折

邮储银行跨界肯德基，打造“金融+美食”新风尚，能否引领新零售潮流？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.