6月2日凌晨,据外媒报道,有“互联网女皇”之称的玛丽·米克尔在美国Code大会上发布了2016年互联网趋势报告。报告称,语音已成为人机交互的新范式,其中,以百度语音搜索为代表的新型交互方式正在解放用户双手和眼睛,扩展了“永远在线”的概念。
米克尔表示,过去两百年的时间里,人机交互一直处于不停地进化之中,尤其近75年间,更是每隔十年便会有一次大的创新,而现在,语音应当是最有效的计算输入形式。
“首先,语音对于用户而言是十分快速的,”米克尔表示,人每分钟平均可以说150个单词,而打字却只能输入40个单词。尤其是在中文交流环境中,由于手机尺寸较小,输入汉字比输入英文更加困难,中国人对语音输入的需求更加旺盛,而这也是百度语音搜索逐渐为人们所依赖的重要原因。
“其次,语音输入无需动手和即时操作的特性,使得这种人机交互十分简单方便.”米克尔研究了2016年美国网民使用语音的场景和原因,她发现,当人们在家里或在汽车里,如果双手不方便、急需得到结果时,语音输入将会是最方便的形式。而这种情况同样发生在中国,语音搜索不但满足了不擅长文字输入的老人和孩子,更极大地方便了年轻人的多种场景化使用需求。
除此之外,语音输入的个性化和多轮交互也备受用户喜欢。米克尔解释道,这种交互方式将帮助人们逐渐告别键盘,并且能够根据之前的问题/交互/位置/其它语义,来理解问题的大背景。这与百度副总裁王海峰在此前媒体开放日中提出的“要用语音搜索消灭键盘”理念不谋而合,集成语音识别、语义理解、深度问答、知识推理等能力于一身后,相较于键盘输入,百度语音搜索已经能够满足用户的多种复杂需求。例如,当你向百度搜索语音询问,“孙li主演的电视剧”,只需要增加一句“茉莉的莉”,百度便能够进行充分的上下文理解,自动识别用户想要寻找“孙莉主演的电视剧”。
这种“会倾听爱思考”的特性便是米克尔谈及的“人对机(P2M)语音交互的普及关键”——机器能够听懂并理解用户的语音需求。此外,米克尔“低噪音环境的语音搜索”预期,目前在百度语音搜索上已能够充分满足,甚至在少量词语没听清楚的情况下,百度语音搜索还能在大数据的支持下,准确“猜”出用户需求并给予满足。比如,它能够将“回家的愿望主题歌曲”修正为“回家的欲望主题歌曲”。
相关数据显示,从2014年到2016年间,全球API调用百度语音识别以及文本转语音(TTS)的每日使用量急速攀升,百度语音在百度产品中使用率快速增长。自2014年第二季度起,百度语音输入增长4倍以上,输出增长26倍以上。其中,在搜索方面,越来越多的年轻人开始习惯“搜索动口不动手”。