滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

百度发布全新语音大模型，成本大降50%-90%，交互体验再升级！

时间：2025-03-31 17:15:06 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在今日的百度AI DAY盛会上，百度公司震撼发布了其首个基于创新互相关注意力（Cross-Attention）机制的端到端语音语言大模型。这一突破性技术不仅在电话语音问答场景中实现了超低时延与超低成本，还使得调用成本较行业平均水平显著降低了50%至90%。

与此同时，百度旗下的文小言品牌也迎来了焕新时刻，率先接入了这一前沿模型。文小言不仅迎来了多模型融合调度、图片问答等功能上的全面升级，更在语聊效果上实现了拟真度的飞跃。此次升级后，文小言支持重庆、广西、河南、广东、山东等多地特色方言，进一步拓宽了使用场景。

据百度介绍，该语音大模型在训练和使用成本上极具优势，推理响应速度极快，将用户等待时长从行业常见的3-5秒缩短至约1秒，极大地提升了语音交互的流畅性。这一技术突破，无疑将为用户带来更加高效、便捷的语音交互体验。

更新后的文小言还支持“多模型融合调度”功能，整合了百度自研的文心X1、文心4.5等模型，并接入了DeepSeek-R1等第三方优质模型。用户可以根据需求选择“自动模式”，一键调用最优模型组合，或者选择特定模型完成特定任务，从而进一步提升响应速度与任务处理能力。

文小言的图片问答功能也得到了显著加强。用户只需拍摄或上传图片，即可通过文字或语音提问，直接获取深度解析。这一功能不仅适用于数学题目的实时解析，还能帮助用户对比商品参数、价格，辅助购物决策。

为了满足用户对图片多维解读的需求，文小言还新增了“图个冷知识”功能。用户可以预设“历史学者”、“科技达人”等人设视角，为同一图片赋予不同维度的解读。例如，当用户询问“猫为何偏爱窗边”时，文小言能从狩猎本能、能量获取、领地意识等多个角度给出独特且有趣的解读。

百度语音首席架构师贾磊在活动中透露，这是百度在业界首个推出的基于全新互相关注意力（Cross-Attention）机制的端到端语音语言大模型。他表示：“在满足一定交互指标的前提下，该大模型的调用成本远低于行业平均水平，推理响应速度极快，将语音交互等待时间压缩至约1秒，极大提升了交互的流畅性和用户体验。同时，在大模型的加持下，我们实现了流式逐字的LLM驱动的多情感语音合成，使得语音交互更加情感饱满、逼真且拟人化。”

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

广东重奖人工智能与机器人外资项目，最高可达1.5亿元！

04-01

太阳AI大模型“金乌”问世：精准预报耀斑，准确率超九成！

04-01

用友BIP YDS发布：智能开发新引擎，助力开发者效能跃升十倍

04-01

诺基亚迎来新任掌门人，Justin Hotard接棒引领新航向

04-01

阿丘科技VisionChina2025：解锁AI工业视觉新篇章，展品亮点全揭秘

04-01

Check Point领跑GigaOm攻击面管理报告，彰显外部风险管理实力

04-01

RAGFlow携手DeepSeek，青云科技助力用户智取信息高地

04-01

宇树科技王兴兴辟谣：蚂蚁集团与中国移动投资计划不实

近期，市场传言四起，指出专注于机器人领域的独角兽企业宇树科技正酝酿一项新的资本动作，计划吸纳蚂蚁集团及中国移动作为新的战略投资者。据称，双方目前正处于深入交流的阶段，具体投资比例尚未最终确定。这一消息源自业内知情人士，其透露此次融资并非全面开放的新一轮募资，而是有针对性地向特定投资方开放有限份额。

04-01

国家天文台联手阿里云，发布“金乌”太阳大模型，预报M5级耀斑准确率超91%

04-01

大模型时代数据标注行业变局：Innodata能否乘风破浪？

04-01

瑞声科技参与大客户侧键模组创新，人形机器人产品正加速开发

瑞声科技(2018.HK)2024年收入创历史新高，为人民币273.3亿元，同比增长33.8%。毛利率为22.1%，同比提升5.2个百分点，净利润同比增长142.7%至人民币18.0亿元，盈利能力大幅提升。其中，2024年下半年电磁传动及精密结构件业务分部收入同比增长31.3%至人民币60.7亿元，环比

04-01

武汉斥资1亿成立城市发展科技公司，业务版图涵盖多项AI技术

04-01

元戎启行周光：要实现物理世界通用人工智能，得先实现RoadAGI

近日，元戎启行作为国内人工智能企业代表，再度受邀出席NVIDIA GTC大会。元戎启行CEO周光发表了技术主题演讲，表示“要实现物理世界通用人工智能，得先实现RoadAGI”，并发布道路通用人工智能平台——AI Spark(以下简称Spark平台)。*元戎启行的RoadAGI战略RoadAGI是元戎

04-01

DeepMind审查升级，AI研究自由受限？科学家心声引关注

04-01

AI赋能供应网络计划，企业如何实现库存成本大幅降低？

04-01

点击查看更多 +

全站最新

宇通轻卡引领新时代！全球首发176度大电量纯电轻卡，续航无忧

雅迪华宇电池二季度战略研讨会：以双轮驱动，开创行业新篇章

蔚来3月新车交付量破1.5万，一季度同比增长40.1%！

一念草木中指控喜茶抄袭，喜茶回应：已启动内部调查

2024新能源汽车行业年报大揭秘：哪些趋势引领未来？附下载链接

星纪元ET纯电版上市，20万级市场迎来C级SUV全能新王者

热门内容

本栏最新

太阳AI大模型“金乌”问世：精准预报耀斑，准确率超九成！

用友BIP YDS发布：智能开发新引擎，助力开发者效能跃升十倍

诺基亚迎来新任掌门人，Justin Hotard接棒引领新航向

阿丘科技VisionChina2025：解锁AI工业视觉新篇章，展品亮点全揭秘

RAGFlow携手DeepSeek，青云科技助力用户智取信息高地

国家天文台联手阿里云，发布“金乌”太阳大模型，预报M5级耀斑准确率超91%

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.