灵云科技9月18日讯:捷通华声宣布推出灵云智能办公平台—Aioffice,并面向社会大众全面开放。
灵云智能办公平台集成了当前最先进的四项人工智能技术——语音识别、语音合成、图像识别、机器翻译等能力,将一站式解决办公过程中遇到长录音转写、文字语音转换、图片文字转换、机器翻译等耗时费力的枯燥工作,减少如记者、编辑、文秘、商务、学生等人们在语音、图像、文字、翻译等办公业务中所消耗的时间与精力,让人们在充分享受人工智能技术的同时,全面办公效率。
语音识别在Aioffice中并不是转写简单的、时间短的语音,而是集采访长录音转写、会议记录长录音转写、课堂长录音转写、电话长录音转写等多种技能于一身,帮助企业及个人解决在工作中遇到的各种长录音转写问题。
如记者或编辑为赶稿整理录音时,一个小时的录音一个人转写时至少要两个小时;领导急需会议记录时,整理繁杂的录音需要录音时长两倍甚至更多的时间,而且讨论大家七嘴八舌,是谁在说话非常容易分不清楚;在考证复习时,复习没有文字稿,效率大打折扣,培训录音整理成文字稿的时间甚至比复习时间还要长。而灵云智能办公平台,将一键解决以上问题,只需要提供录音,会在最短时间内将录音转写成文字。
灵云语音识别技术经过多年的技术积累,以及数千家企业用户的应用实践和磨合,具备了识别率高、响应速度快、支持话者分离和智能语音端点检测,口音和方言适应能力强,以及可定制模型、支持多种处理模式等诸多优点。除支持中文识别外,还支持英文、维语等多语种识别,特别是中文普通话,识别率可达96%以上,实时率在0.3以下,提供自由说识别、语法识别、关键词检出和语音质检分析等丰富多样的功能选择,已经广泛应用于呼叫中心、客服中心的IVR导航、自动语音质检分析等需要用到智能语音技术的领域。藉此,捷通华声在语音识别领域占据国内市场的绝大部分份额。
Aioffice中的语音合成功能,可以将大段话由文字转换为录音,例如一部长篇小说,可以分成多个章节进行转写并命名,方便在不能够看书的时候听书;也可以将一长段需要在会议、会场朗读的文字使用语音合成系统合成;再有超市需要较长的语音播报,可以直接使用Aioffice中的语音合成进行合成。
Aioffice采用最新一代高音质合成器,音质效果更加真实、干净、细腻;利用模型优化了算法,大大提高音色的逼真度和音质的细腻度,克服机器味底噪;增加了数据训练流程,比传统训练方法稳定性更高;优化了音高算法,使朗读更加抑扬顿挫;优化了计算效率,默认情况下比旧版快2.5倍,资源消耗大幅降低;更全面的地名词库,精心裁剪,可辨认全国常见地名、机构名;支持用户定制化需求:针对用户特定词汇、语句保证读音正确、韵律自然;丰富的语种与发音人:语种可支持中文普通话、粤语、英语、日语、韩语、德语、法语、俄语等二十几种语言;已发布男声、女声等风格。
2014年9月,捷通华声凭借在智能语音产业界所做出的贡献与绝对领先的智能语音技术能力,在“第六届中国行业信息化奖项评选活动”上一举夺得“一举夺得年度中国智能语音产业领军企业大奖”,成为智能语音产业中第一个获得此项殊荣的企业。
在此次Aioffice中应用的智能图像识别技术,捷通华声在研发与应用方面有着多年的深厚积累,通过与清华大学的战略深度合作,灵云OCR技术经过了大量用户验证。具有识别率高、稳定性高、操作系统适配性好、资源占用低等特点,技术水平已经到达国际领先水准,能够充分满足移动互联网时代广大客户对纸质文档智能识别及快速提取的需求。
灵云OCR在识别准确率上,对中、英文的识别率处于国内绝对领先水平,识别率可以达到99%以上,并支持常用的宋体、仿宋体、楷体、黑体、雅黑等打印字体和隶书、魏碑等较难识别的字体。创新性的支持中英文混排的识别,以满足实际情况下的中英混编文献的文字识别需要。同时,灵云OCR具有强大的图片处理能力,可以对不同的识别图片进行旋转、倾斜校正、版面分析、版面属性设置等操作,还可以根据实际语境对识别结果进行自动校正。而且,后处理功能保证了对识别信息进行再处理的需求得以实现,用户可随意对识别信息进行拼接、拆分等处理。
灵云智能办公平台中,不仅有语音识别、语音合成、图像识别的人工智能能力,而且还具有多语种翻译的能力可以将语音识别、图像识别的文字转换成英语、日语、韩语、法语等各种语言,也可将识别出的英语、日语、韩语、法语等转换成汉语,一键完成了两项工作,极大的方便了翻译处理的工作。
灵云科技 源自清华 灵云全面推动中国人工智能产业发展
灵云智能办公平台源于全球第一个最大、最全的人工智能技术开放平台 — 灵云(www.hcicloud.com)。灵云是一种可以用语音、手写、拍照、手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,灵云平台的创建,标志着人工智能产业全面迈入云服务时代。
2013年,清华大学产业基金入资捷通华声,成为捷通华声第二大股东,共同创立“清华灵云人工智能研究中心”,共同致力于推动人工智能产业在中国的发展。在双方的战略合作中,捷通华声将发扬清华大学在国家科技进步、国民经济建设中的强大推动力与影响力,全面推进灵云发展战略,促进提升清华大学人工智能技术在产业中的影响力,助力清华大学构建“学术超前、科研领先、产业化推广最强”的领导地位,共同实现“灵云科技源自清华服务全球”的战略发展规划。
通过与清华大学的广泛合作,灵云平台“如虎添翼”,作为人工智能领域最大最全也最具影响力的云服务平台,灵云面向产业全面开放,以“云 + 端”方式,为产业界提供国内最高水平的灵云语音合成(TTS)、语音识别(ASR)、声纹识别(VPR)、手写识别(HWR)、光学字符识别(OCR)、指纹识别(FPR)、人脸识别(AFR)、机器翻译(MT)、语义理解(NLU)等全方位人工智能能力。灵云平台自推出以来,通过与华为、中兴、阿里、京东、百度等数以万记的国内外各行各业企业的广泛合作,使中国13亿社会大众充分感受并体验到各项人工智能技术为现代生活所带来的轻松与便捷。秉持开放、分享、合作共赢之发展理念,灵云平台成功引领中国人工智能产业全面进入云服务时代,2014年,被产业内评为“最具影响力人工智能云服务平台”。
伴随人工智能产业在世界范围内的高速发展,以及清华灵云人工智能研究中心、清华海峡研究院人工智能研究中心的陆续创建,捷通华声将以清华人工智能研究中心研究力量为依托,更加专注人工智能技术研究与产业化应用,与合作伙伴精诚合作,共同创建良好的人工智能产业生态,共同推动中国人工智能产业的发展进步,为中国人工智能产业的发展做出应有的贡献!
未来发展,灵云智能办公平台将陆续将灵云人工智能开放平台的各项能力都吸纳其中,使合作伙伴可以真正的完全使用灵云智能办公平台来处理日常工作,帮助企业及个人改善办公方式,让人工智能深入到工作中的每一点。
灵云平台更多信息请访问:www.hcicloud.com
灵云智能办公平台更多信息请访问:aioffice.hcicloud.com