近年来,AI技术的迅猛发展正在悄然改变着人们的搜索习惯。Gmail创始人之一Paul Buchheit曾在社交媒体上预言,AI将颠覆搜索引擎的结果页面,这一观点如今在中国市场得到了验证。
过去一个月,百度、夸克、微博、知乎、小红书等平台纷纷接入了DeepSeek技术,与大模型的深度思考能力相结合,重新定义了内容的呈现方式,开启了一场“深度搜索”的较量。为了探究这些平台的深度搜索能力,我们围绕健康、数码、美妆、游戏及热点事件等日常问题,对DeepSeek R1、百度AI搜索、夸克、微博智搜、知乎直答及小红书的AI搜索应用“点点”进行了对比测试。
接下来,我们测试了关于电脑内存条选择的问题。这一看似专业的问题,实则隐藏着对用户友好性的考验。从准确性上看,各平台表现相当,均考虑到了不同使用场景、兼容性和稳定性。但在内容的呈现上,DeepSeek R1、微博智搜、知乎直答和“点点”更偏向于用户友好的风格,先让用户按需求对号入座,再结合专业知识进行解释。微博智搜和“点点”还引用了专业数码博主的科普视频,使得内容更加通俗易懂。
在美妆领域,我们选择了含玻色因和视黄醇的护肤品能否一起使用的问题进行测试。由于美妆内容是营销的重灾区,我们期待AI搜索能够给出客观的答案。结果显示,百度和夸克在内容上相对客观,自动过滤了一些“软植入”,而“点点”则出现了较为明显的营销内容。微博智搜则采用了浙大一院主治医生的视频讲解,对成分作用机制进行了通俗易懂的介绍,营销味儿较弱。
最后,我们测试了平台对于热点事件的反应能力。起因是315晚会对蜜雪冰城门店使用隔夜柠檬片的报道,在舆论端出现了反差。我们期待AI搜索能够准确回答或梳理这一焦点事件。结果显示,DeepSeek R1、夸克和百度主要参考的是新闻报道和自媒体文章,措辞和逻辑相似,但缺乏UGC内容的情感和真实体验。微博智搜则提到了消费平权、品牌形象的防御性建构等维度,展现了更多的视角。而“点点”则提到了情感绑架、自我PUA式消费等议题,同样呈现了平台用户的价值观。
通过此次测试,我们发现各平台的深度搜索能力各有千秋。大模型的深度思考能力决定了体验的下限,但内容决定了体验的上限。同时,深度搜索不仅仅是“找信息”,更是“找真实、权威、有可信度的信息”。社交平台上的UGC内容成为了一把双刃剑,既可能让答案更有“人情味儿”,也可能“污染”生成内容的准确性。因此,如何在保证信息准确性的同时,融入更多真实、可信的内容,将是各平台未来需要努力的方向。