近日,百度在广东深圳举办的“语音连接人与服务”活动上,对外展示了其免费开放的语音技术和平台。而在语音技术最为核心的语音识别、语义解析、语音合成三种技术之中,百度语音不但在技术上处于业界领先地位,同时也是业界最为开放的免费语音技术服务供应商,这其中就包含百度领先的离在线语音合成服务。
据记者了解,百度语音的离在线语音合成服务,已率先在业内提供完全免费的离在线融合的语音合成解决方案,让用户在WIFI环境下可以体验高自然度的音质,而在移动网络环境下,也可以实现“0”流量消耗的优质语音体验。
(“语音连接人与服务”活动现场,观众体验智能手表等设备的语音服务)
百度率先实现拼接合成和参数合成两项技术的融合
语音合成即将文本输入转换为语音输出,英文称之为Text to Speech(TTS)。百度语音能够提供在线、离线两种模式的TTS引擎,在线TTS利用云端资源,可将网络请求的文本转换为自然流畅的语音,而离线TTS则只使用本地资源,让用户在不消耗流量的情况下也能获取服务。
与在线TTS和离线TTS相对应,百度已实现了业界领先的拼接合成和参数合成两项技术的研发。拼接式合成,基于海量文本语料的自然语言理解技术和深度加工的专业发音库,经过多层次的建模让韵律表现更稳健又有表现力。而其智能的弹性单元挑选策略,能从大规模录音语料库中找到所求。由于拼接合成所需资源较多,所以通过在线合成的方式提供服务。参数合成则来源于高质量声学建模和模型压缩技术,以及音质优良的声码器技术,在大大降低资源的同时,可以离线生成接近真人发声的合成效果。
有了业界领先的拼接合成和参数合成技术作为基础,百度通过对不同应用场景的深入分析,推出了离在线融合的语音合成解决方案,让语音合成技术的使用更加便捷、人性化。
SDK 免费开放,为用户与开发者节约成本、提升体验
离在线融合的语音合成技术解决方案,通过一套SDK,为开发者提供了自动根据网络状况提供合成语音服务的功能,大大降低了开发成本。同时,由于在线合成在文本分析准确率、合成音质等方面有一定的优势,在网络条件允许的情况下,可以最大限度地改善用户体验,节约用户的移动网络使用成本。
目前,百度语音合成已应用至百度框、百度翻译、百度语音助手、百度百科、百度导航、百度书城以及去哪儿等软件之中,SDK支持Android,IOS,Linux三大平台,免费开放给广大合作伙伴和开发者,帮助其创造更符合用户语音需求的特色产品。
而据百度语音相关负责人介绍,除了语音合成外,百度语音识别、语义解析技术也具有业界领先的技术水平。目前,百度语音已面向多个领域免费开放,包括智能手机领域的联想、中兴、魅族等行业重量级伙伴,智能家居领域的联想智能电视、康佳智能电视、SONY智能电视等。此外,还有信利智能可穿戴设备、特斯拉电动汽车等厂商,都使用了百度语音开放技术。这些领域的应用与合作,一方面为合作伙伴的产品研发降低了门槛,为用户带来更加出色的语音交互体验,另一方面也让语音技术在多场景应用的环境下,获得前所未有的快速发展。