5月27日至28日,机器之心SYNCED主办的 2017 全球智能机器峰会(GMIS 2017)在北京正式举行,云集国际顶级人工智能大咖,LSTM之父Jürgen Schmidhuber、加州大学伯克利分校教授Stuart Russell、腾讯 AI Lab 副主任俞栋、Citadel首席人工智能官邓力、蚂蚁金服首席数据科学家漆远、搜狗 CEO 王小川、科大讯飞执行总裁胡郁、思必驰首席科学家俞凯等行业专家带来权威分享。同时,人机大战、主题Session、IME主题展等设置亮点十足。
智能语音是本次大会的一大议题,思必驰在IME主题展中构建了可实时互动的语音世界,其语音演示设备“声象”带来了实时对话体验,成为现场虚拟的小小志愿者,智能家居、智能机器人和智能车载产品则成为了现场围观的焦点。在大会主论坛,思必驰首席科学家俞凯则进行了《迈向智能认知型对话交互》的主题分享,探究了语音研究的问题及方向。
下面就随小编来一探究竟吧!
IME主题展:思必驰语音世界
图1 思必驰“声象”
思必驰“声象”成了现场一大亮点,通过这台设备,思必驰语音技术的演示和体验都非常的直观,“多轮对话交互”让观众与“小驰”进行实时闲聊;“语音合成”功能可将观众的声音实时转化成了知性女声、磁感男声、萌动童声、孙悟空、周星星等名人声音;“语音活动导览”则捕捉用户指令,成为虚拟志愿者,可以介绍相应活动行程及嘉宾信息,成为大会小帮手。
图2 思必驰智能家居解决方案展区
在智能家居解决方案展区,思必驰展出了联想智能音箱、360巴迪机器人、小萝卜二代机器人、诸葛小明床头灯、大华乐橙小乐机器人等产品,这些产品应用了定制化的智能家居方案,采用的环形6麦阵列、线性4麦阵列等软硬一体化方案、纯软件的语音对话等技术,具备声音定位、回声消噪、基于场景追踪说话人意图等功能,体验十分便捷有趣。
图3 思必驰智能车载解决方案展区
在智能车载解决方案展区,思必驰带来了搭载思必驰AIOS对话操作系统的捷渡智能后视镜、车萝卜HUD、祖师汇云龙系列智能后视镜等产品,这些车载产品,通过语音实现发微信、打电话、导航、播放音乐/电台、查询天气、查询路况等多种操作,带来了智能驾驶体验。思必驰是阿里Yun OS for Car的深度合作伙伴,已携手打造了多款车载后装爆品,目前在车载后装市场占有率第一。
GMIS2017主论坛:迈向智能认知型对话交互
思必驰联合创始人/首席科学家、上海交通大学俞凯教授主持了大会主论坛,并发表了主题为《迈向智能认知型对话交互》的演讲,解析了思必驰语音技术的发展,并探讨目前语音领域的机遇和挑战,以及如何迈向智能认知型对话交互。
图4 上海交大教授、思必驰联合创始人/首席科学家俞凯
俞凯教授指出,从感知智能的角度来看,机器在语音领域已经非常逼近人类甚至超过人类水平了,业内在语音识别领域的研究也在不断进步,例如思必驰上海交大实验室推出的VDCNN抗噪算法模型、PSD新型解码框架等,在提升识别率及识别速度方面,均有极大进展。但目前,对话交互,无论是研究还是工程都是要解决“端到端的非配合的自然口语交互系统”问题,这当中与之前相比更值得关注的是“非配合”,俞凯谈到,这三个字实际上是所有难点的源头。
目前,行业内大都依靠“深度学习+大数据”来解决对话交互的问题,但这是远远不够的,俞凯教授指出,解决这一问题,还需要关注:第一,交互的时机问题;第二,强化学习是未来非常重要的发展方向;第三,解决用户异常的处理;第四,自适应,在对话交互当中,语义理解的自适应要远比语音识别更重要;第五,大数据不能解决所有的问题,要逐步进行非结构化小数据处理。俞凯教授指出,“智能的感知+认知的进化”将是未来人机口语对话系统发展的重要方向。
智能语音是这届大会论坛极为关注的一大话题,国内外专家学者均对此做出了研究分析,腾讯 AI Lab 副主任俞栋探讨了《语音识别领域的前沿研究》;加拿大麦吉尔大学语言学副教授Jessica Coon进行了《外星人、田野调查和通用语法》的主旨演讲;俄亥俄州立大学终身教授汪德亮发表了主题为《基于深度学习的语音降噪技术》的演讲。对人工智能语音技术的研究的关键性问题及商业化应用进行了分析。
从GMIS2017的现场来看,人工智能类企业迎来了极大的发展机遇,无论是语音、图像、虹膜等交互模式,还是大数据、云计算等主流技术均成为了行业关注的焦点。加快技术的商业化落地,才能真正带来智能生活,回归用户,着眼需求,人工智能技术价值将会进一步爆发。