8月20日,科大讯飞智能家庭语音产品发布会圆满落下帷幕,全自然交互平台——讯飞语音云3.0,也在现场揭开它神秘的面纱,让我们一起回顾发布会现场讯飞语音云3.0为我们带来了哪些精彩内容!
持续升级:稳固人机交互
距第一次语音云发布会已近4年时间,在这4年里,久经市场检验和开拓创新的语音云提供的能力越来越丰富和个性。从最初的具备语音合成、语音识别、语音搜索等基础能力的语音云1.0,到集成了自然语言理解、个性化语音识别和语音唤醒、声纹识别等创新能力的语音云2.0,语音云一直在努力奔跑。语音云3.0又带来了哪些突破呢?
1) 继续领跑语音识别
方言识别:针对方言专门打造了方言识别引擎,目前已经开放了粤语、东北话、天津话、四川话、河南话、山东话等十种方言,并率先用于讯飞输入法中,Wifi下识别响应时间140ms;发布离线听写技术,DNN并行训练技术获得突破等,业内全面领先。同时,发布会现场还发布了讯飞输入法V5聆听乡音版。
抗噪方面:通过“前端麦克阵列+本地降噪算法+云端降噪模型”的组合,形成了讯飞独特的“净音”方案,使得在120KM/H高速环境下识别率依旧超过85%,在奔驰、通用的全球语音评测等比赛中均获第一;
2) 声情并茂的语音合成
支持多语种多音色,同时提供特色音库、个性化音库和音色转换接口,让您随心所选。
3) 随叫随到的语音唤醒
低功耗、高唤醒率、低误唤醒率以及多唤醒词定制等诸多优势,让唤醒随叫随到,在手机上运行一天耗电量不超过0.4%,在嘈杂环境下,唤醒率超过97%。
加速布局:开启全自然交互
除了基础能力持续升级外,语音云3.0还在人脸识别、手势识别等方面加速布局,构建全自然交互平台,打造语音生态体系。
1)明察秋毫的人脸识别
科大讯飞与香港中文大学汤晓鸥教授及其团队合作,将国际顶尖人脸识别技术应用于讯飞语音云3.0,识别率99.15%,胜过目前所有的同类软件,甚至超过肉眼识别,为讯飞语音云带来了全新的识别能力。
2)得手应心的手势识别
基于视觉的手势识别,可应用于手机、车载车机产品中,让人机交互更加智能、更加随心自然。
鼓励创新:讯飞语音云创新应用大赛
同时,发布会对“语音云创新应用大赛”的获奖开发者进行了颁奖,其中盲人应用争渡读屏获得大赛金奖,高德地图、Glass x分别获得了用户体验奖和创业团队奖,得到了大赛评委的一致认可。当前,加盟语音云的合作伙伴已超过40000家,期待越来越多的开发者能够借助讯飞语音云平台腾飞梦想。
加速梦想:亿元开发者扶持计划
发布会还开启了亿元开发者扶持计划,只要您有好的想法,好的创新产品,讯飞亿元开发者扶持计划都将是您实现梦想的强力助推器,帮助广大开发者在互联网大潮中开拓市场。