在2016年博鳌亚洲论坛IT领袖圆桌会议上,百度总裁张亚勤提出“智能+”发展思路,表示“智能+”将是“互联网+”的延伸和下一站。“智能+”将加速物理世界与数字世界的融合,成为传统产业升级转型的创新引擎,人工智能将成为推动互联网下一轮升级和变革的核心驱动力。
在AlphaGo大胜围棋世界冠军李世石之后,全世界的目光都集中在人工智能技术的发展之上。百度作为国内在人工智能研究领域一直处于领先地位的互联网公司,其引以为傲的语音搜索技术也因强大的人工智能支撑而引起了业内人士的广泛关注。
懂得理解与思考的百度语音搜索
“百度语音搜索不仅仅是语音识别和搜索的简单相加,因为有了人工智能,它更懂得理解和思考,能帮助人们更便捷自然地获取信息、找到所求,并带动整个生态的发展。” 百度技术副总裁王海峰这样评价百度的语音搜索。
百度的语音搜索,不仅通过人工智能做到了“听”和“说”,还能尝试完成人类复杂的沟通行为。百度语音搜索的人工智能技术在集成了语音识别、语义理解、多轮理解、信息匹配、语言生成、语音合成、情感表达等一系列单项任务能力于一身后,便能完成与人类的正常沟通。
其中,多轮理解尤为体现了人工智能所发挥的作用,它使得语音搜索在人与机器的对话中可根据上下文语境进行多轮交谈。具体而言,就是基于语义结构理解,指代消解等技术,理解用户会话的上下文信息,实现对话的补全与替换,从而真正理解用户的需求。
比如,用户想用语音搜索“孙莉的电视剧”,搜索引擎首先显示热门的“孙俪的电视剧”的结果,而只需语音补充一句“茉莉的莉”,百度语音搜索的人工智能就能够结合这句话和上下文,准确理解并把搜索词从“孙俪的电视剧”改写成“孙莉的电视剧”。
语言是思维载体 百度语音搜索更重智能思考
相较于微软、谷歌等互联网科技公司,百度更注重人工智能的实际应用。语音接口是百度人工智能的强项,被《麻省理工评论》列为2016年十大突破技术的Deep Speech 2,就是语音识别功能,这项技术已经广泛进入到我们的生活之中。
当用户打开手机百度使用语音搜索“好看的电影”,手机百度会为用户呈现出电影排行榜,随后,继续使用语音搜索“美国的”,便会收到手机百度提供的美国好看的电影排行榜信息。目前,百度的部分语音识别技术已用于Tesla,或许这就是CoDriver智能语音副驾的雏形。
谈到语音搜索和当下火热的人工智能的关系,王海峰博士表示:人工智能实际上是希望让机器可以拥有若干能力,可以让机器学会人的听、说、看、行,进而开始有思考——即机器学习,但就人的思考而言,和语言密切相关,后者是思考必需的知识和思维的载体。