2015年12月16日,第二届世界互联网大会在美丽的乌镇盛大开幕。这是一个传承了中国 千年文化的如画小镇,在互联网没有落地小镇之前,江南细雨依旧是它神秘的面纱。在积极地推行互联网与各行业相结合加速发展的过程中,焕发熠熠生机。由中国政府倡导的,邀请 各国家和地区的政要、相关组织、互联网企业领军人物、相关专家参加的世界互联网大会选取这个互联网经济发达的小镇作为永久会址,旨在深入交流促进中国及世界互联网经济的发 展壮大。
网络建设可以视为互联网发展的大动脉,许多互联网技术的升级和服务的提供都依托于网 络。今年,中国移动已经是第二次为大会提供网络通信服务建设及保障,保障会场中的“大 动脉”能畅通无阻,乌镇移动4G平均速率达到50Mbps。
图1-中国移动展厅工作人员展示4G+高清语音
本次大会,中国移动向世人展示了先进4G+、pre 5G通信技术,吸引了不少人的关注。然 而,更受关注的是中国移动发布的三款新产品:1“.互联网+”能力平台;2.物联网+OneNet平台;3.“灵犀云”智能语音平台。在担当网络高速公路建设者的同时,中国移动也在谋求与时俱进、突破自身的天花板,拥抱新技术新产品,这是转型路上充满勇气的选择。
图2-中国移动新技术新产品发布会
“互联网+”能力开放平台具备基础通信、智能管道、大数据、业务支撑和IT能力,依据这5类原子能力,延伸设计出各套解决方案服务于各行业。物联网是指中国移动搭建物联网公 共服务网络,自主研发的专网运营管理平台,为行业客户提供智能管道解决方案;物联网设备云平台则主力推动物联网生态环境的构建。
“灵犀云”智能语音平台
互联网从PC桌面时代延伸到现在的移动互联网时代,更多的移动设备进入消费者的视野,这是一个需要革新人机交互方式的时代。
智能语音提供了一种免于接触设备的交互方式,解除频繁点击触摸屏的枷锁,将多数设备连 接到局域网中就可以实现“一呼百应”的声音操控。灵犀云的发布,展现了传统运营商莫大 的魄力!中国移动和科大讯飞强强联手,以积累多年的大数据和讯飞提供的世界一流语音技术,共同打造了这个平台!会上演讲者分享了以下的内容:
1) 语音识别&语义理解
灵犀云的语音识别就是机器设备能知道人类说了什么内容;语义理解就是机器设备能够分析 人类说话的含义。语音识别线上综合识别率为97%,能够识别中文、英文和粤语,甚至是 中英文混合识别并作出智能标点预测;用户还可以上传自己的词表做到个性化识别。
语义理解线上综合识别率为92%,是基于选定的不同场景来返回理解后的结果,支持20多 种场景,帮助设备真正理解用户的意图,做到更贴心的服务。比如:选择餐饮场景,并在搜索功能中使用,“我想吃美食”,应用便会进行识别然后将附近的美食地点搜索呈现给用户。
这两种能力常被用于语音输入,比如讯飞输入法APP的语音输入功能、灵犀语音助手APP的语音输入功能,不需要频繁地在触摸屏上敲字,让用户的视线不用再集中到屏幕上;语音命令,比如智能家居设备,这项能力帮助用户隔空操纵设备,就像魔法一样神奇;
2) 语音合成
语音合成能把文字转化为人声进行朗读播放,据介绍灵犀云的总体合成效果已经超过真人。灵犀云语音合成支持不同的音色,不同的发音人(18种),支持中英文混读合成,更惊艳的 是它支持中英粤、台湾话、湖南话、四川话和东北话等国内方言。众所周知,阅读文字是我们获取知识和资讯主要的方式之一,但它牢牢地“绑架”了双眼,而且略显沉闷。把安静躺着的文字化为生动的声音,使得印象更深刻同时解放了双眼。
它常被用于语音导航(客服电话中将常规服务对话进行合成)或者阅读类APP的语音朗读, 例如:iReader及“和阅读”,为用户提供不同发音人、不同语速、在离线的朗读功能,深受 用户追捧,离线服务量日均达3千万次。
3) 声纹识别
声纹,是用电声学仪器显示的携带言语信息的声波频谱。简单理解,就是类似于指纹的人体 生物特征。每个人的声纹都不一样,对此进行识别分析就可以识别出说话人的身份。会上发布的灵犀云声纹识别准确率已经达到95%。
由于语音样本采集非常方便,只需要一个麦克风,这项技术的应用价值非常大,比如在恐袭、突发性公众安全事件中识别、监控人群;在家庭中用于防盗;在电子支付中,使用声纹作为 支付密码;一款中国移动的APP灵犀锁屏,则将声纹识别作为解锁手机的核心体验点,创新的体验得到大量的好评。
4) 语音检测
这是通过智能语音技术自动对发音水平进行评价、发音错误、缺陷定位和问题分析的软件系 统,具备中文普通话和英文发音水平自动评测技术。
也许由机器来为人类的发音水平进行打分比较难以想象,但这一切真的到来了。会上发布的 数据显示灵犀云的自动评分效果已达到甚至超过人工专家打分水平(1分以上的机器自动评 分误差率仅为5%,专家评分误差率达17%)。语音检测能帮助老师们极大减少工作量,降 低口语考试测评的误判率。
智能客服
智能客服是中国移动结合传统客服业务和灵犀云语音技术,为移动用户提供的一项创新服务,综合使用了语音识别、语音合成、语义理解,仅需客户在通话中说出自己的业务需求,经过语音系统的识别理解后,直接将客户导向一个业务节点。例如:客户说“我想办理50M的流量叠加包”,智能客服系统识别客户的话语后,立马将客户导向办理50M流量叠加包 节点,仅需确认是否办理。
这一应用生动地体现了语音技术带来的便捷交互体验~据介绍灵犀云将以上能力封装于SDK中,已经面向中小开发者开放使用。
此次世界互联网大会上的发布展现了中国移动在自身转型过程中与时俱进的勇气,能力开放 平台、物联网结合“互联网+”、“万物互联”的大趋势;灵犀云智能语音平台结合未来人 机交互的大趋势。扬帆起航,顺风乘浪,顺应这个时代的大潮流,方能远行万里!