如果问你,《钢铁侠》里托尼.史塔克最形影不离的朋友是谁?答案一定是:其智能语音助手“贾维斯”!
贾维斯不仅照顾钢铁侠生活的方方面面,监测他的身体变化,开发了钢铁侠的机甲,甚至在战斗的生死关头,救人生命。
钢铁侠代表的是正义的力量,是与“恶”作斗争的使者。
可怕的是,在互联网时代,某些猝不及防的“恶”却成为了一些“流量”炒作者的“工具”。
7月3日,发生在百度AI开发者大会舞台上的那一幕不用我多说,大家都已知道了。李彦宏先生那一句“What‘s your problem?”是对作恶者的愤怒,也是发向炒作者的质问。
而现场观众的那一声声“加油”,那些自发响起的鼓励的掌声,就是对“恶”最好的回击。
在7000多人面前,内心强大的李彦宏仿佛钢铁侠一样,很镇定地说:AI前进道路上,会有各种各种意想不到的事情发生。但我们前行的决心不会改变,坚信AI会改变每一个人的生活。
而所有人都在“刷屏”突如其来的一幕时,犀利君想,如果李彦宏有一个“贾维斯”那该多酷,可以实时预警,并能保护他。
也许,这一天并没有想象中遥不可及。
李彦宏:来一首Lady Gaga的《Shallow》 。
小度开始播放这首歌曲
李彦宏:……大家觉得这首歌怎么样?收藏这首歌。
小度:已经收藏啦。
极客模式下的小度,你不用每次都呼喊“小度小度”,小度能自己分辨主人的需求,看起来,这是不是有那么一点“贾维斯”的意思?!
托尼.史塔克是《钢铁侠》的主角,贾维斯的“戏份”不输主角,也是剧情的关键。正如李彦宏在百度AI开发者大会的“声音大戏”。
李彦宏开场时展示的“全双工免唤醒”小度在家交互功能,引来现场一片掌声。李彦宏还通过小度连线车里的李书福,与“数字人”轻松调侃……一幕一幕,都让人们隐约看到人工智能的未来的影子。
表面上看,李彦宏上演了一场年度的“声音大戏”,实际上,它更像是一部表达隐晦的“梦想照进现实”的科幻大片!
用声音“度量”
三年前,“小度”还叫另一个名字“度秘”,一个用起来“很僵”的语音助手。那一年,李彦宏首次在百度世界大会公开百度AI的发展,提出:移动互联网时代已经过去,互联网的下一幕是人工智能。
很多人以为,智能音响只是个没用的玩具,顶多放点音乐,但百度敏锐的发现了另一面:通过人类的声音,撬动人工智能这个小宇宙,并因此构建一个新的“星球”体系内核。
三年过去了,“度秘”变身“小度”,从最初的1.0版,升级到了5.0。
语音技术在过去1年的发展超出常人想象:语音技能交互次数提升近2000倍,语音技能增长800%,技能类型增长126%。
而李彦宏与小度在公开场合的对话, 每一次都比上一次多一点小惊喜。
大卫.布拉特纳在他的科普书籍《宇宙的尺度》中,声音是一个重要的测量宇宙的维度,宇宙浩瀚,用时间、温度、尺寸、数字测量宇宙之外,我们还用耳朵倾听,就像用手指去触摸空气里的振动一样。
而让我们开始用声音去操控一台智能音响时,它已不仅仅是音响……在小度在家上,第三方技能成为第一大应用,超过音乐和长视频。
百度的一组数据显示:
截止到2019年6月,百度的小度助手激活设备量已超过4亿,月交互数超过36亿。首个基于流式注意力的语音识别线上服务,百度的这项服务可以让语音识别速度提升,准确率提高15%-20%。
声音变成一种“度量”的尺度。因为声音,人工智能这个小宇宙开始经历“爆炸”式的进化;也因为声音,我们看到人工智能小宇宙进化的速度。
声音“炼金术”
吴伯凡说,语言是一种意义的共识,它的通信范围就是意义和约定覆盖的范围。凭此,个体进行连接,成为群体、超级群体、共识网络……语意网络是一个给个体赋能的系统,赋能的过程是“意义炼金术”,这是人类通过某种特有的能力产生一种巨大的赋能行力量的过程。
声音,作为语言的另一种呈现,在人工智能的技术下,似乎也正在进行一场“炼金术”。
2018年研究机构Ovum做过一个预测,到2021年,地球上的语音助手数量,将和人类一样多。
这是什么概念?语音助手可能无处不在,它的表现形式可能是智能音箱,也可能是你驾驶的汽车,可能是一场旅行……
7月3日,当李彦宏和吉利的李书福对话时,让我们看到了新的机会和可能:
李书福坐在他的吉利博越PRO中,因为云计算和人工智能,“它不仅仅能自己思考,自我进化,还能越来越聪明,善解人意,理解人情,与人进行沟通和交互。”李书福说,未来汽车,可能会变成主人的秘书、保镖……解决主人的各种困难和问题。
声音“炼金术”背后的人工智能“小宇宙”,对各种行业正在进行着赋能式改造。李彦宏:hi,数字人,欢迎你来到我们的AI开发者大会,你先介绍下你自己吧。
数字人:您好,初次见面,可以先叫我小浦。
李彦宏:你有名片吗?
数字人:呃……我还在实习,领导没给我印名片(现场一片笑声)。
李彦宏:那你在实习岗位学得怎么样啊?
数字人:我正在跟几位很厉害的师傅学习,他们已经多年获得浦发最佳理财经理,客户都超爱他们。
百度最新发布的一款为远程声音交互打造的芯片“鸿鹄”,可以适配车载语音交互和智能家居等场景,超过130万开发者,每天调用次数同比增长108%。
未来可以预见的是,在旅游咨询、医疗健康、移动通信等领域,都可能诞生“数字人”。
李彦宏通过智能语音在内的等人工智能系统,重新定义一个物体、一次服务、一场体验……就像是一种“炼金术”,但触手可及。
“声临其境”为更好
湖南台《向往的生活3》正在热播,也带火了其中一位常驻“嘉宾”——小度。最近有一期,宋茜、容祖儿、陈乔恩、王丽坤、吴亦凡几位超级大明星齐聚蘑菇屋,但他们都被小度给“征服”了。小度收到指令,播放了最近大火的歌曲《大碗宽面》,让原唱者吴亦凡在现场都惊呆了;小度的“颜值”拍照功能,让女神们跃跃欲试,看到仙女般的照片后,陈乔恩和容祖儿立马变成小度“宠粉”,都说,真的好想要一台!
不仅如此,在此前的《声临其境》第二季,小度就火过一轮。
明星小岳岳、万茜等一个个配音,就让你进入特定的“剧情”和场景。不管是哆啦A梦版的《无间道》,还是边江和万霖重现《三生三世十里桃花》,那种顿时”入戏“的奇妙感觉,似乎跟智能语音有着异曲同工之妙。
在北京的一个盲人按摩店,只要通过一句语音,就能打开空调、设定温度、开关遮光帘、设个闹钟……每个到店按摩到客人,由此“声临其境”。
而这其实是百度2个工程师的灵光一现,他们曾有一次到这个按摩店,发现因为视力障碍,盲人师傅工作时有诸多不便,于是他们自掏腰包买了小度智能音箱,同时改造了这个按摩店的空调、遮光帘、灯带等。
从此,“声音”,为盲人师傅开了一扇新世界的窗户。AI助盲,从北京的一个店开始,未来也将慢慢扩到更多店、更多城市……
这是李彦宏的技术信仰。其背后支撑的是一套越来越完整的体系——百度大脑,一个拥有全体系AI能力的技术平台。
百度大脑已到5.0版本,其在语音、语言和知识、视觉等领域,实现6项技术的突破,比如在语音方面,通过语音合成技术,仅需20句话就能制作一个人的专属声音;其知识增强的语义理解框架ERNIE已累计学习10亿以上知识,全面刷新了中英文双语自然处理任务效果……
迄今,百度大脑的平台向开发者开放了210项AI核心能力!而这距离2016年李彦宏百度大脑过去不到3年。
“你的声音,就像是你的DNA或指纹。”2017年,卡内基梅隆大学的科学家曾通过语音分析,还原出讲话者的面部三维图像。技术研究机构未来今日研究所的创始人艾米.韦布也提出类似的观点:如果DNA可以定义你的本人,那从你的声音就能捕获你的完整人格。
对百度和李彦宏而言,2019年的年度“声音大戏”先拉开帷幕,但精彩才刚刚开始。
也许因为百度人工智能,在不久的将来,每个人都拥有一个属于自己的“贾维斯”,它可以变成你的学习伙伴、秘书、保镖、家庭医生……真正“声临其境”,科技为更好。Do Better!