10月24日,一年一度的人工智能盛会——科大讯飞全球开发者节在安徽合肥举行。开发者大会现场,科大讯飞AI研究院常务副院长刘聪揭秘了科大讯飞卫冕夺冠的背后故事——独创的最新智能识别、合成与翻译技术。
科大讯飞在业内取得了一系列辉煌成绩,仅今年便有多项赛事夺冠。6月,在ICDAR2019公式识别的比赛中,科大讯飞一举获得在线和离线识别两项冠军;8月,在国际语音合成大赛暴风雪比赛中,科大讯飞以独创性听感量化编码框架和GAN建模技术将自然度得分刷新至4.5MOS分历史新高,卫冕夺冠。
科大讯飞AI研究院常务副院长刘聪介绍说,在语音识别核心算法上,基于深度全序列卷积神经网络(Deep Fully CNN),科大讯飞创新研发出了高精度的记忆增强式多通道端到端语音识别技术。并通过分析语音输入、语音交互和语音记录这三大典型应用场景,不断实现语音识别的真正落地。与此同时,基于语义分割与自适应感受野的通用图文识别核心技术,加速OCR的本地化布局,通过“云+端”的模式为用户提供更好的产品体验。此外,刘聪表示,融合领域知识的多通道半监督约束编解码翻译技术,提升专业术语词和行业翻译专业性,是科大讯飞通过CATTI专业测试的核心算法秘诀。
科大讯飞作为国家开发创新平台,秉承以“以技术为基石,以开发者为本”的理念,旨在为开发者持续带来核心技术红利。2010年,科大讯飞发布以智能语音和人机交互为核心的人工智能开放平台——讯飞开放平台。为了更全面地服务各类型各阶段的开发者与企业用户,讯飞开放平台陆续推出了提供人工智能专业知识服务的在线学习平台——“AI大学”。以及提供专业资源服务的“讯飞A.I.服务市场”。这成为国内知名的融汇人工智能开发者、研究者、学习者、创业者的生态开放大平台。如今,全新iFLYOS 2.0为了满足广大开发者的自定义需求,在开放度上进一步提升,在用户体系、语义服务、智能硬件操作系统开发等层面满足开发者自定义需求。同时,科大讯飞还联合生态合作伙伴,为人工智能赋能的各行业量身定制高灵活性、高集成性、高可靠性安全架构的专用语音芯片。
正如刘聪所说,伴随着5G和万物互联时代的到来,科大讯飞将怀抱开放共赢的心态、依托核心关键技术,聚焦于探索智能识别与合成应用的更高阶段,逐步跨越行业促进应用价值的深化挖掘,给人们带来全新的产品和升级的用户体验。