ITBear旗下自媒体矩阵:

李彦宏的语音战争

   时间:2019-09-03 16:11:13 来源:益群网编辑:星辉 发表评论无障碍通道

李彦宏是什么时候爱上小度的?

没人能准确说出个时间点,只是隐约记得,在食堂看到李彦宏吃饭,他全程都用语音技术和小度聊天。

几天前,知名市场调研机构Canalys发布了2019年第二季度全球智能音箱出货量报告,小度第二季度出货量450万台,首次超越Google位列全球第二,创造了中国智能音箱季度出货量最佳排名。

李彦宏对小度一直是偏爱的。今年AI开发者大会上,带着熟悉的Robin式笑容,身着白色衬衫的李彦宏在台上一边与小度聊天,一边与场下观众亲密互动,“能听懂,会应答”的小度赢得了场下观众的阵阵掌声。

台上的李彦宏气定神闲,台下的技术人员一身冷汗。现场噪音很多,小度几次唤醒都不够灵敏,“翻车”这种事在科技圈不是没有发生过,一向以技术见长的百度如果在现场演示时出了错,砸的可是百度的金字招牌。

没有人敢冒这个险,除了李彦宏。从首款带屏智能音箱“小度在家”发布,到全双工免唤醒的小度助手5.0更新,每一次小度亮相,李彦宏都坚定地站在台前,充当小度最帅的代言人。

得益于李彦宏在人工智能领域的长期思考,百度一直对AI拥有着最敏锐的嗅觉。

今年重庆智博会上,李彦宏提到,人工智能已经从过去津津乐道的酷炫效果变成了一个社会共识,上升为一个国家战略。一个明显的变化是,人工智能“脱虚向实”逐步渗透到了各产业领域,真正融入了人们的日常生活。

贝恩此前出具的一份报告中称,未来人机交互方式中,语音交互会占到30%左右。对于被视为“中国AI名片”的百度来说,语音技术是智能音箱的灵魂,也是百度一块必须抢夺的高地。

这场战役,李彦宏不能输。

语音大战背后

说起来,语音交互的发展历史已经有差不多近百年了,自计算机诞生之初,人类就在探究语音识别,想要实现机器与人类的交流对话,不过仅“让机器正确识别人类说了什么”这一步,就走了几十年。

直到90年代IBM的viavoice,Microsoft的Whisper等一众语音识别产品相继问世,识别人类语音的正确率才算有了重大突破,智能语音也才具有了一定的商用价值。

近几年在人工智能技术的加持下,智能语音的发展开始呈火箭般急速蹿升,仅过去一年,语音技能交互次数就提升近2000倍,语音技能增长800%,技能类型增长126%。

近两年语音大战格外焦灼,但早在六年前,李彦宏就已布下了局。

2013年,在大家都没感知到语音技术的重要性时,他就提出“语音技术会根本性地改变人们使用互联网和手机的方式,人机对话最近几年会很快进入实用阶段”,并花费百万美元重金奖励中文语音识别引擎团队。

同年,也就是2014年,亚马逊的Echo拉开了智能音箱这场大战的序幕,很快阿里、百度、小米、华为等众多国内科技巨头纷纷入局,天猫精灵、小度智能音箱、小爱同学、小艺……从无人问津到“千箱大战”,智能音箱四年销量翻了近千倍。

市场急速升温,入场玩家更是拼杀激烈,拿出“不破楼兰终不还”的气势重金补贴,阿里将499的天猫精灵直接降到99元,百度以299元的小度在家试水后又推出了89元的小度智能音箱,李彦宏为此投入了上亿元的补贴费用。

为何要如此“下血本”抢夺市场?很简单,五年过去,智能音箱早已不仅是音箱了,它背后展现的是一个企业的AI能力,更承载着互联网巨头抢占语音交互时代流量入口的深厚期待。

智能音箱的火爆,映射的正是移动互联网向AI时代转变的轨迹。

百度Q2财报最新数据显示,小度累计激活设备数已经超过4亿台,同比增长4.5倍,每月语音查询超过36亿次,同比增长7.5倍。一个能听懂你的意思,并按照你的要求为你提供服务的智能助理成为越来越多人想拥有的伙伴。

研究公司Ovum预测称,到2021年,地球上语音助手的数量会和人类一样多,人们会越来越倾向于向语音助手寻求情感助。

这种需求也直接转化为了金钱,单就智能对话市场来说,2018-2022年复合增长率为53.2%,2022年市场支出规模将达270.5亿元。

今年美国投资机构Mangrove Capital Partners发布的2019年语音技术报告中也预测,到2025年,语音经济的规模将超过移动应用达到1万亿美元,语音会为新一代科技公司创造巨大的商业价值。

事实证明,李彦宏赌对了。

语音战争之上

在李彦宏的带领下,2018年百度凭借实时语音翻译技术及服务以"关键玩家"的身份入选了MIT "全球十大突破技术",成为唯一连续三年入选该技术榜单的中国公司。

今年年初,百度公布了在语音领域的四项重大技术突破,其中在线语音领域全球首创的流式多级的截断注意力模型(SMLTA)被业界人士称为“登月计划”。

语音战争之上,百度枕戈待旦

今年3月搭载百度DuerOS系统的“小度在家”首发时,李彦宏曾说,“小度在家就是由AI催生的新产品形态,是中国市场革命性的AI新物种,也将打开新的应用场景。”

4个月后李彦宏就对小度完成了一次“自我革命”。百度AI开发者大会上演示的小度“全双工免唤醒”功能,不仅实现了“一次唤醒,多轮交互”,还能在与他人对话的同时互不干扰地实现人机交互,无限对话和全双工刷新了人机交互的上限。

除了全双工免唤醒功能,小度助手5.0还首创了家庭信息流和行业领先的家庭通讯与通知功能,可以为用户提供24小时个性化、人性化的智能服务。

三年前,“小度”还叫“度秘”,一个用起来有点“僵硬”的语音助手,三年后,“度秘”变身“小度”,从1.0迭代到了5.0,蜕变为既整合了百度AI语音和图像技术,又能赋能第三方的 “开放平台”。

为了大幅提高深度语音识别技术的准确率,尤其是抗噪能力,百度技术团队收集了近7000个小时的语料数据,在样本中加入了十五种背景噪音,比如餐厅、汽车、地铁等,将样本扩张到了10000小时,然后让系统在噪音中去识别这些语音信息。

这还仅是识别技术抗噪能力的测试,还有语音合成,语音交互,神经网络架构等等,每一项技术研发背后都是团队一遍遍的数据收集、测验、分析、改进……不厌其烦,可是这些,外界根本看不到,甚至百度很多内部员工也不甚了解,因为技术大牛们都泡在实验室里闷声做事,也不说话,只有对外发布新产品的时候,大家才意识到:哦,技术又更新了。

三年,1095天,五次迭代升级,数不清的技术打磨,即便有了先发优势,李彦宏也从未放缓前行的脚步。

今年一季度百度业绩首次出现了亏损,外界对其质疑声不断,内部又大力推行改革,引入OKR考核系统,全面取代KPI,很多人用“内忧外困”来形容百度如今的处境。

不过对于这些,李彦宏从未公开表态,也没有向外界解释,只是在建国70周年的时候,为耄耋之年的抗战老兵送去了一份礼物:通过百度大脑智能语音合成技术合成了一位已故老排长的声音。

分别64年后,老兵以这样的方式听到了消逝的声音,与排长完成了隔空对话。这一刻,冷冰冰的技术也开始有了温度。

《今日简史》中说,在一个信息爆炸却多半无用的世界,清晰的见解就成了一种力量,思考,是你我与众不同的真正力量。老兵脸上的两行热泪,胜过外界万千赞许。

Do Better,科技为更好,也许,这就是李彦宏经过思考后向外界传递的百度力量。

小度助手挂帅

百度AI领头羊的地位已经开始凸显,尤其语音技术更是可圈可点。

今年李彦宏携五大高管集体亮相,发布了远场语音交互AI芯片鸿鹄,百度大脑5.0,小度助手5.0,小度大金刚等四款音箱新品,每款产品背后都离不开小度助手的支撑。

小度已经成为李彦宏打造AI时代的交互中枢,超级入口和操作系统,由小度延展出的百度AI生态体系的轮廓,也渐渐清晰。

小度的总负责人景鲲算得上百度近两年上升最快的一位年轻人,来百度之前,他曾是“微软小冰”的创造者,来百度之后,他成为了“小度”的掌舵人。

从创建度秘到推出对话式人工智能操作系统DuerOS,成为国内最具影响力的AI开放平台之一,景鲲仅用了三年。用他自己的话说,小度助手已经从“运筹帷幄之中”到“决胜千里之外”了。

作家海明威曾在《流动的盛宴》中写下一句经典:假如你曾去过巴黎,这辈子巴黎都会在你左右。

对景鲲来说,语音交互就是他心中永远无法磨灭的巴黎。他是个典型的理想主义者,在人们都质疑AI发展的时候,他坚信对话式人工智能将无处不在,“我是一个愿景驱动的人,我很清楚知道自己在做什么,我有我的信念和理想,我希望为我的信念和理想奋斗。”

一个细节看出景鲲的做事风格。据百度内部人士透露,今年的AI开发者大会彩排那天,景鲲为了一张PPT,反复让技术后台演练,尝试了N次,直到自己觉得顺了才翻了篇。“一场彩排一张PPT就如此较劲,可想而知景鲲对产品的打磨该是怎样的严格。”

这些年,小度助手一直保持着稳定的迭代速率,从2015年的“度秘”到2017年发布的Duer OS,2018年发布的小度在家1S、小度电视伴侣等一系列智能硬件产品,再到2019年推出的小度助手5.0,每隔一段时间,李彦宏都会向外界交出一张展现AI实力的答卷。

全面挺进AI

李彦宏不喜欢讲故事,喜欢聊技术,在他眼里,技术就是百度的基因。

翻遍他的采访也会发现,他三句话不离技术,想挖点公司发展过程中有趣有料的小故事,都要通过身边的人,典型的理工男。

创始人的基因很大程度上决定了公司的气质,百度的技术骨干也大多沉默寡言,没办法,物以类聚人以群分。

可低调不说不代表什么都没做,Apollo自动驾驶开放平台,对话式人工智能交互平台小度助手和百度大脑已经成为支撑百度AI生态体系最核心的“三驾马车”,也是李彦宏决胜AI时代的最大底气。

今年智博会李彦宏又呼吁,希望人工智能的发展能够更加关注安全和效率,加快基础设施的建设,充分利用开源和开放平台,把自主权握在自己手中,技术进化再度提上了日程。

百度人对技术有一种执念,且自百度成立之初就已根深蒂固。

一位智能语音团队的高级工程师回忆了这样一个细节。

去年百度世界大会的时候,百度CTO王海峰想在现场演示小度最新的智能语音交互技术——Endless Conversation,但毕竟是“现场直播”,环境嘈杂,还有太多不可控因素,大家担心演示会失败。

有人在开会时用了二十多页PPT希望说服李彦宏放弃现场演示:“过去的经验告诉你,现场演示是不可能的!”

这时,一向低调的王海峰站了出来,坚定地说:“我们的语音技术没有问题,你尽管去做,搞砸了算我的!”一句话让在场的人都愣住了,一旁的李彦宏沉默了片刻,说道:“你们去做吧。”

后来的结果证明,百度经受住了考验。

年复一年,百度不停向外界展示着一家科技巨头的技术实力。

如今5G等新技术的出现给AI发展带来了新的挑战,推进人工智能发展的路上依旧面临重重困境,不过就像李彦宏在今年的开发者大会上所说的那样,“AI前进的道路上,会有各种意想不到的事情发生。但我们前行的决心不会改变,坚信AI会改变每一个人的生活。”

大战还在继续,战场上硝烟弥漫,但李彦宏进击AI的决心,从未动摇。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version