ITBear旗下自媒体矩阵:

人工智能处于爆发前夜,微鲸低能耗及语义识别领先业界

   时间:2017-05-18 09:41:39 来源:互联网编辑:星辉 发表评论无障碍通道

据相关机构预测,到2018年,30%的人机交互将通过语音完成,2020年,至少50%的搜索将是语音搜索。的确,如今的智能电视市场竞争已经进入白热化阶段,“人工智能”的迅速走红,使其成为厂商提高产品附加值的“新宠”。可见,未来的智能电视市场,将不再是单纯的价格比拼,技术创新差异化、渠道、品质、体验等都会成为今后的较量点,而AI技术,则成为了其中实现差异化的关键。

5月,人工智能电视圈异常热闹,16号乐视4U和18号小米4纷纷开新品发布会,微鲸也将于17日召开智生薄出——微鲸智能电视线下媒体体验会,它们对智能语音有哪些探索,又有哪些成果呢,这让外界期待值满满。

厂商抢滩布局人工智能 远场语音或成“拦路虎”

在智能电视领域,今年以来,小米、乐视、微鲸等纷纷不约而同的发布了具有语音交互功能的电视新品,将人工智能语音技术逐渐推向前台,智能电视行业或将进入“人工智能时代”。

目前,语音交互或者说语音识别技术的门槛在于远场识别率和语义分析,现实可能并没有想象中那样完美。多位语音识别领域专家曾指出,“目前技术水平,一般远场识别的错误率是近场识别错误率的两倍左右”。所谓远场语音识别,就是指解决远距离语音识别的问题,以保证真实场景下的语音识别率。如果想在电视大屏端实现远场语音交互,可以说是一个不小的挑战。

回归现实,远场语音交互的落地需要一个过程,其核心点就在于技术、商业上的正反馈需要一定的启动周期。显然,技术不好用,产品体验就不好;而反过来产品没销量,技术就缺乏打磨的场景,内容配套也就不会跟上。这种互锁状态就会形成一个冷启动周期,在这个周期里做技术的公司需要打磨自己的技术,在没那么大量的产品落地实现前,产品公司则要接受现在的技术现实,精心打磨自己的产品。

突破技术创新,才能成为人工智能电视“先行者”

面对技术难题,在充满未知和挑战的智能语音领域中,创业者才真的有颠覆性的机会。近日,暴风TV发布了一款能实现远场语音交互功能的电视。其实早在暴风之前,也就是今年4月份,微鲸在醉·薄A系列新品发布会上,通过视频向在场的多家媒体展示了其远场语音识别功能,其中包括,精准内容点播、智能情绪识别、语音进程控制等方面的场景化应用,看过之后,大家无不拍手叫绝。

目前,远场语音识别技术的难点在于如何通过语义识别将休眠状态下的电视唤醒,因为休眠状态下电视的能耗仅有0.5W,这对于整个行业都是一个极大的挑战。而微鲸低调的科研团队攻克了这个难点,在媒体体验会现场,参加活动的媒体记者见证了喊一声“芝麻开门”就能唤醒沉睡中的电视的奇观,微鲸当之无愧成为业内首家能真正实现大屏自然交互的品牌。

远场语音交互技术虽然困难重重,但其实从语音交互到精准识别,也是一个考验硬实力的过程。微鲸人工智能电视凭借强大的自主创新和研发能力,在语义识别上有实质性的突破,可以根据用户的一句话或者含义模糊的词语,就能根据片源库进行搜索和匹配,通过大数据分析,即可精准匹配海量优质片源,做到真正懂用户所需,让找片源变得更加便捷自如。

行走浪潮之巅 微鲸全面拥抱人工智能

毋庸置疑,人工智能正炙手可热,未来几年亦是如此,包括智能电视行业在内的各个领域都在大力推广人工智能。

乐视超级电视的语音交互现在能完成搜节目、调音量、查天气等基本的操作,但智能语音的优势要等到横跨整个生态链时才能成气候;小米智能电视语音功能目前也不太成熟,连王川都直言,他们目前只是在语音技术上跨出了一小步,体验还并不太成熟;而微鲸在智能语音方面,从精准语音识别、远场语音识别技术,到内容搜索、查询天气等基础功能,再到第三方应用都已实现,死磕极致的微鲸,相信以后会有更惊喜的场景应用问世。

在大家关注的远场语音识别方面,小米、乐视智能电视中采用的都是第三方捷通华声灵云的解决方案,这个方案中,远场语音遥控器采用环形4麦克风布局方式,可以实现360度声源定位,3到5米距离拾音,有效降低周围环境中的噪声,同时消除电视机播放的声音。同乐视、小米的智能语音相比,微鲸在语义识别领域拥有自主研发能力,并且技术创新差异化明显,在待机状态下,即可一秒唤醒。

可以想象,当你躺在沙发上突然想要打开电视的时候,你可以直接说一句“微鲸,你好”,电视就打开了;或者你想看《欢乐颂2》,你只需说“打开《欢乐颂》第二集”;再比如,你想查看今天的天气如何,可以直接说“今天北京的天气怎么样”,天气信息就出来了;在或者你想给家人发信息留言,可以直接在电视中显示并帮你读出来。

不得不说,在人工智能的滚滚浪潮下,微鲸正以热烈的拥抱姿态,昂首阔步走来,正如微鲸的口号:为新一代生而不同。业内专家认为,语音是最简单、最自然的人机交互方式,同时也是技术难度最大的交互方式,特别是语音交互从近场走向远场落地到真实场景,必须考虑噪声、混响、回声等声学问题,以及数据差异引入的机器学习模型问题,这些都是保证自由人机交互的核心技术。

毋庸置疑,人工智能语音电视正在积极探索更加便捷有益生活服务的尝试,未来前景光明,且无限可能。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version