ITBear旗下自媒体矩阵:

乐乐语音在人机关系中能擦出多大火花?这是个命题!

   时间:2016-05-04 15:38:26 来源:互联网编辑:星辉 发表评论无障碍通道

吸引眼球的北京车展已经落下帷幕,而关于汽车行业未来走势的争论并没有因此而停息。紧随“互联网+”的风潮和众多主力品牌车型的勇敢尝试,此次车展,人们不仅看到了新能源这一未来趋势,同时,汽车智能化的快速发展,正在给我们的生活带来更多火花。

《Her》的启示:人工智能车现实吗?

据了解,本届北京车展上,以主流品牌为主的车系大多标配了智能交互系统,而在此之前,刚惊艳亮相的乐视也携首台生态智能汽车LeSEE、搭载了乐乐语音交互系统的第二代乐视车联版阿斯顿·马丁Rapide S出席车展。作为从不缺少新概念的国内互联网公司巨头,乐视落地展出的“智能汽车”成为了业界和媒体眼中颇有“颠覆”性的代表之一。

实际上,互联网公司对于汽车市场的争夺早已不再限于那块屏幕了。过去几年里,汽车厂商一直希望互联网公司安于做车联网服务提供商,但现在互联网公司似乎并不满足于此,直接进入“造车”环节的野心开始显现,进而投身于人工智能汽车的打造。

据了解,截至目前,国内已经有7家互联网公司宣布进入汽车行业,这背后除了公司本身的业务布局外,还有政策的推动。今年3月发布的“十三五”规划纲要中,就明确将培育人工智能纳入其中。

因此,业界有人称2016年为“人工智能商用元年”。

曾经在科幻电影上被高度演绎的人工智能如今正悄悄渗透到我们的生活中,无论智能硬件、O2O,还是机器人、无人机、工业4.0等备受市场关注领域的,未来都将迎来无可想象的空间。以至于李彦宏都认为,提升传统服务行业的效率,非常依赖互联网技术,包括推荐技术、个性化技术、大数据分析技术、语音识别、图像识别等技术。追溯这些技术,其实就是所谓的人工智能技术。

人工智能目前给我们带来的更多的是便利和效率的提升,并且在可预见的未来一直都会是这样。但人工智能也是有门坎的,而这些门坎并非不可跨越,其核心就是该如何能够让人机交互就像电影《Her》中讲的那样“更加畅通的交流”。

人机交互到底应该怎样?

从世界上有计算机开始,人机交互就伴随着计算机的发展而进化。DOS时代,人机交互的媒介是键盘;PC时代,人机交互的媒介是鼠标+键盘;智能机时代,人机交互的媒介是智能语音交互……随着智能技术的进一步发展,人类对人机交互提出了更高的需求,期望更自然的人机交互方式。

透过语音使得机器能读懂你,之后执行精准命令。这将改写智能设备人机交互革命,尤其是车载系统,彻底解放双手,未来智能汽车,语音交互是必备交互技术。

实际上,语音交互还能够解决更多问题,将其应用于汽车中,将会彻底解放人的双手,就算是现阶段也能够让驾驶者无需手动去开启如收音机、后备箱、空调、车灯、导航等功能,不仅更加方便,而且更加安全。同时作为智能语音交互系统,当你驾车出行的时候,相当于多了一位能够帮你处理任何车内事物的小助手,可以尽享最佳的驾车体验!

据悉,今年奔驰、宝马和奥迪等厂商也开始整合语音解决方案,试图打造车联网智能语音交互。

乐乐语音究竟又是什么?

机器要能够准确识别语音并像人一样通过理解判断做出回应,需要基于大量的“学习”,通过学习,与人一样根据过去的经验进行判断预测。这种“学习”有两种方法:通过在数据中找寻类似事例来提供解决方案,或是通过归纳许多数据样本的共性来对这件事情做出判断。这也是语音技术发展的难点。

现阶段语音交互领域中以声纹识别最为热门,声纹识别的理论基础是每一个声音都具有独特的特征,通过该特征能将不同人的声音进行有效的区分,这对于人机交互来说至关重要,也是精准识别、安全等方面的保障基础。

尽管在全世界范围内,语音技术走过了漫长的蛰伏期。但正是在近一两年,随着智能手机崛起,语音技术应用也迎来了爆发性增长。在中国已发展了20多年的语音技术,也真正进入到普通人的生活,开始了一个前所未有的快速发展阶段。不少中国本土的语音公司迅速崛起,改变了国外公司垄断中国语音技术市场的局面。

乐乐语音就是其一,尽管与大家耳熟能详的谷歌、苹果、科大讯飞等相比,名气不大,但对于其母公司乐视,应该不陌生。

据悉,乐乐语音隶属的乐乐创新智能科技(北京)有限公司,是乐视控股旗下的公司,乐视超级电视4中的声纹识别功能和第二代乐视车联版阿斯顿·马丁Rapide S中的车载智能交互系统都是出自这家公司。

在北京车展上,其为阿斯顿·马丁Rapide S量身打造的全球首款全方位立体降噪语音识别交互系统更是引起了社会各界的关注,尤其是多路语音采集降噪模组更是全球首家应用于车载交互领域的个性化语音降噪产品,具有里程碑式的意义与极大的商用价值。

据了解,全方位立体降噪语音识别的交互系统是利用多个层面组合技术运用,以降低在语音控制中噪声对语料的干扰。如通过指向型麦克风阵列,只接受固定角度和范围内的声音,从硬件角度上降噪;采用盲源分离、回音消除,从算法上实现语音降噪。创新性开发了多路语音采集降噪模组,即前端通过麦克风阵列,精确地定位语音来源,经过降噪系统提取纯净的语音并对该路语音进行增强及回声消除,同时通过车内六路语音提取器,精确识别车内不同座驾位置人员发出的语音指令从而输入到语音识别模块,反馈出适合该人员的实际操作。

除此之外,乐乐语音的技术团队透露,目前已经研发完成一整套基于车载系统的整体解决方案,为车企及车载系统开发商提供开放性SDK云平台及创新性硬件操作系统,可以广泛适配各类型车载操作系统,实现热唤醒、打断、降噪等强大功能的语音识别技术,通过场景化语义解析,涵盖导航、电台、音乐、电话、应用操控、汽车操控、违章查询、指定地点查询、路况、今日限行等各领域内容。

乐乐语音的多场景应用,对于乐视生态而言,不仅打通了物联网之下的生态链接,还很有可能成为撬动乐视生态智能未来的支点。业界普遍认为,乐乐语音在移动互联网时代有较强的商用指导意义。相信伴随乐乐语音全方位立体降噪语音识别交互系统等里程碑式的产品、技术不断地迭代更新、应用,人类或将提前告别枯燥乏味的人机关系,快步进入智能时代!

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version
关闭
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群