在人工智能领域的一次重要进展中,百度旗下的新型搜索智能助手文小言宣布了其最新一轮的重大更新,这一消息在百度AI DAY活动中正式揭晓,吸引了行业内外的广泛关注。此次更新标志着文小言在功能上的全面升级,尤其是在多模型调度、端到端语音大模型以及图片问答能力方面。
百度官方详细介绍了文小言此次升级的核心亮点——多模型融合调度技术。通过整合百度自研的顶尖模型,如文心X1和文心4.5,并接入诸如DeepSeek-R1和可灵等第三方优质模型,文小言实现了模型间的智能协同。用户在自动模式下,可以一键调用最优模型组合,也可以根据具体需求灵活选择单一模型,这一功能显著提升了系统的响应速度和任务处理效率。
在语音交互方面,文小言同样带来了显著的突破。百度推出了业界首个基于全新互相关注意力机制的端到端语音语言大模型,该模型不仅降低了训练和使用成本,还大幅提升了推理响应速度。在语音交互场景中,用户的等待时间从常见的3-5秒缩短至约1秒,极大增强了交互的流畅性。该模型还支持多种特色方言,包括重庆话、广西话、河南话、广东话和山东话,进一步拓宽了语音交互的应用范围。
图片问答功能也是此次升级的一大亮点。用户现在可以通过拍摄或上传图片,并以文字或语音提问的方式直接获取深度解析。例如,拍摄一道数学题可以即时获得解题思路和视频解析;上传多款商品图片可以对比参数和价格,辅助购物决策;拍摄杯子设计图后,AI能够自动解析风格并生成同款手机壳、支架等周边产品。这一功能不仅为用户提供了更加便捷的信息获取途径,还增强了AI的实用性和趣味性。
文小言此次升级还新增了“图个冷知识”功能。用户可以预设不同的角色视角,如“历史学者”或“科技达人”,为同一图片赋予多维度的解读。这一功能不仅丰富了图片问答的应用场景,还为用户带来了更加多元和有趣的交互体验。通过这一系列的更新,文小言在人工智能助手领域树立了新的标杆,展现了百度在AI技术上的深厚积累和创新能力。