工作时,你有“微信语音恐惧症”吗?一收到语音信息就顿感焦虑,不得不中断手中工作,靠近听筒一条条听下去。若有一两个字听不清,或是碰上夹杂方言、英文的语音,还得反复听上好几遍。想要解决这个在线交流的难题,其实对一款输入法的AI能力考验极强。作为AI深度赋能的百度输入法,已率先打破行业先例,为用户带来了句子整句识别、方言识别以及中英文混合识别能力突出的“最强语音输入”。
(图:2019年初百度输入法“AI新输入·全感官输入2.0”发布会)
2019年1月,百度宣布语音技术取得一项对全球学术界和工业界都具备重大意义的技术突破——流式截断的多层注意力建模(SMLTA)将在线语音识别精度提升了15%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。SMLTA技术已经应用到百度输入法的在线语音识别、中英混合语音输入、多方言和普通话混合语音输入,以及离线语音等众多功能中,将在线语音识别精度提升了15%,超越行业最高水平15%,同时离线语音识别准确率已达到在线语音识别效果。通过AI技术,百度输入法开启了输入法2.0时代,无论是黑科技感、用户体验感和功能丰富度均备受追捧。
(图:百度输入法在线语音相对准确率超越行业最高水平15%)
借助SMLTA,百度输入法还实现了业界普遍认为较难实现的中英文混说识别,在完全不影响中文语音输入准确率的情况下,能进行高精准的中英文混合语音识输入。在7月3日的百度AI开发者大会上,百度语音技术部高级总监高亮展示了百度输入法中英混输技术,当他现场念出一段高难度中英混杂“Rap”:“你的这个新model效果比baseline好多少,探索技术的depth和scope是我们的责任,我很喜欢barrier这个词,AI的value其实就是break barrier.”百度输入法零误差地识别出来,语音输入得到了准确理解并根据语义进行正确断句,同时保持了非常快的速度,边说边上屏,无需等待整句念完便可呈现识别结果,实现真正的“中英自由说”。
(图:2019年百度AI开发者大会现场展示“中英自由说”)
对于中国人来说,普通话、方言、英语是日常生活中必不可少的语言。除了“中英自由说”之外,百度输入法还将普通话和六大方言融合成一个语音识别模型,实现了方言与方言、方言与普通话的混合语音输入的“方言自由说”。如四川话、东北话、河南话都可以和普通话混合输入,解决了在线交流时,因方言繁多带来的交流差异。
AI技术应用已成为当前手机输入法市场竞争的“主旋律”。据艾媒咨询(iiMedia Research)发布的《2019上半年中国第三方手机输入法专题研究报告》(以下简称《报告》)指出,百度、搜狗、讯飞三大输入法AI技术的应用丰富,与其他输入法拉开较大差距,其中,百度输入法在技术功能应用方面优势更为明显,AI创新成果显著。
(2019年中国手机输入法AI技术应用对比)
据《报告》显示,2019上半年中国手机输入法用户语音输入的使用渗透率为57.4%,整体语音输入用户规模已超4亿。其中,百度输入法语音输入的用户占比持续保持行业第一,规模高达2.71亿。百度输入法的多语种混输功能开创了输入法语音输入的新模式,引领着行业的发展趋势,如今已成为用户最关注的AI语音功能。