ITBear旗下自媒体矩阵:

携手央视上线虚拟主播“纪小萌” 科大讯飞人工智能又有新突破

   时间:2019-05-05 18:22:42 来源:互联网编辑:星辉 发表评论无障碍通道

近几年,人工智能大火,各种A.I.产品如雨后春笋般出现,录音笔、翻译机、虚拟主播,给人们的生活带来了些许乐趣,也不断影响着今后的科技发展。

最近,央视《中国新闻》栏目播出了一条名为“人工智能虚拟主播图像诞生记”的新闻报道。在这条视频中,央视主播纪萌近距离走进人工智能,亲自体验了虚拟主播的诞生过程。

仅需要经过语音、唇形、表情动作等一系列的信息采集,并且输入文本合成主播图像之后,虚拟主播“纪小萌”便开始自己的第一次上岗工作,其语音相似程度,连纪萌本人都不禁感叹称其“声音相似程度很高”。

其实,虚拟主播图像是经过提取真人主播动作特征,运用深度学习技术联合建模而成。在音视频数据全部采集之后,人工智能根据现有数据进行学习分析,生成一个独一无二的信息数据。经过数据处理和深度学习后,虚拟主播可以实现实时完成音视频的播报。这项技术的成熟应用,有利于提高新闻记者的工作效率,更智能的帮助主播完成播报工作,同时也为未来的广播、电视报道方向提供了新的借鉴思路。

本次虚拟主播“纪小萌”的上线,除了依靠科大讯飞人工智能虚拟主播图像技术外,还离不开其“声音复刻”技术。我们都知道,声音是一种具有一定振荡频率的声波,而声波有振荡频率、振幅、波形等物理参数或特性。所以在现实生活中,由于每个人的声带发育程度,导致声音各有不同。对于声音技术来讲,想要对于音量、音调的模仿可以简单做到,但是如果能达到音色、语调等方面的完美呈现却很难。

借助科大讯飞“声音复刻”技术的突破进展,通过对所收集的音频素材进行分析计算及建模,便可以打造出音色高保真还原的声音。

此外,人工智能在声音复刻方面的应用,也让我们的生活更加有爱。今年年初,在一综艺档节目里,科大讯飞团队便利用声音复刻技术帮助小女孩实现了“留住已故爸爸的声音”的心愿。

 

根据科大讯飞业务线负责人邵静文介绍,声音复刻技术在日常生活中已经有着广泛的应用。通过智能设备每个人都可以定制自己的声音,用这项技术创造一个虚拟的自己,让家人朋友感受到我们更贴心的陪伴,实现“声音分身”,并且她还希望人工智能技术在给人类减少一些(重复性)工作的同时,给生活带来温度,能够帮助到更多的人。

作为一位奔走在科技前线的小编,基哥的办公场所当然不单单局限于办公室,还可以是上下班的地铁上,以及各种发布会的现场。

而基哥平时工作的亲密伙伴除了Leo、电脑外,就要数基哥的手机了。毕竟码字这件事是不限端口的,在地铁上也能用手机码字,多方便啊!

不过常年码字也使基哥深刻的明白了,选择一款了解你的输入法是一件多么重要的事。

那今天基哥就从横向测评一下市面上几大品牌旗舰机的输入法,分析一下到底哪家,才是比较“懂你的”输入法。

先来看下完整的成绩单吧,下面的表格就是基哥在做完各项测试之后,对5款输入法对应测试项目的排名:

可能有小伙伴想问基哥这个排名是怎么来的,当然是基哥纯手工统计来的,为了贯彻落实公平、公开、公正原则,详细的测试步骤和排名依据,基哥也都一一罗列出来了。

#FormatImgID_2#

拼音输入准确率PK

日常打字基哥都习惯用拼音输入方式,就是将句子拆成多个词输入,对于单个单词,还会用全拼音和首拼音混合输入。

拼音输入方式也是市面上最为主流的输入方式,所以拼音输入准确率,便是衡量一款输入法成熟程度的重要指标。

为了保证公平,基哥向身边30位小伙伴收集日常聊天内容,每位小伙伴超过500个字,针对这些内容标注拼音,然后在各个手机输入这些内容,每输入一份聊天内容就清除一次数据,避免互相影响。

最后,再根据输入法的选词栏的结果与收集到的内容进行对比,看看候选词是否为基哥想要输入的字,以此来计算拼音输入法的准确率。

考虑到拼音输入法9键和26键的用户数不相上下,所以基哥就两个都测了,而且还分首选词准确率和前5候选词命中准确率。

首选命中是指,当用户是在输入完拼音后,用户想要打的词,出现在输入法选词栏的推送词的首位,即算首选命中。再用首选命中次数除以总输入语料数,结果就是首选准确率。

同理,当想要打的词出现在选词栏备选词的前5个中,则算是前5名中。而前5准确率便是用前5命中次数除以总输入语料数。

最终的测评结果如下表:

在拼音准确率这一局百度输入法华为版完胜,无论是9键输入,还是26键输入,百度输入法华为版的拼音准确率都要优于其他4款输入法的。苹果的系统输入法的表现则有点差,几项准确率都是垫底的情况。

除了拼音准确率,基哥还测试了5款输入法的整句准确率,就是测试用户在打完句子的完整拼音之后,各个输入法对词的推算准确率。

对此,基哥共选取了1000条收集来的短句(每句5~10个字),邀请5位小伙伴,用拼音9键和26键全拼音输入的方式,用相同的拼音输入这1000条语料,再根据输入结果,来统计对应输入法的首选准确率和前5准确率。

从测试结果可以看出,苹果的系统输入法这一项还是比较优秀的,各项准确率都是最高。百度输入法华为版在9键和26键的前5准确率中都和苹果系统输入法并列第一,在首选准确率方面则以微小差距排名第二。

搜狗输入法的准确率也在可以接受的范围内,但是在识别一些非日常用语时,搜狗输入法的组词功能就要吃力些,需要用户将句子切成一个一个词再进行组句。

(原句:深化国家监察体制改革)

也就是说,搜狗输入法要经过一番调教才能达到较高的准确率。

讯飞拼音9键输入方式就很是不友好了,识别准确率要远低于其他几款输入法。

所以就拼音输入法来说,苹果的系统输入法和百度输入法华为版都是不错的选择。但是习惯用拼音9键的同学,基哥建议还是直接绕开讯飞吧。

在测试过程中基哥也发现了,虽说26键的精确度高、打字快,但是因为键位小,就很容易按错键,而且还容易闹笑话。

本着看热闹不嫌事大的准则,基哥便对这几款输入法的误触进行测试,看看哪家的输入法最尴尬。

基哥共选取了1000条短句,每部手机各邀请了五位长期使用该品牌手机的26键用户(使用同品牌手机超过半年),每位受邀者在对应的手机上,都用26键全拼音输入1000句语料。

然后再将每位用户的输入的总误触次数,除以1000句短句的总拼音数,得出的结果即为26键误触率。

别说,几款输入法还都挺智能的,都能自动识别输入拼音中的误触。就算基哥不更正错误拼音,输入法也能推测出正确的句子,真是贴心!

不过,几款输入法在误触率上的差异还是比较大的,其中,百度输入法华为版的误触率为0.83%,是误触率最小的,而的搜狗输入法OPPO版的误触率则高达1.90%,误触率居然比百度的2倍还有多。

基哥建议,如果经常要和客户或老板发信息的同学,尽量不要用搜狗输入法OPPO版。不然哪天打错字,把老板给调戏了,那饭碗可能就跟着丢了!

#FormatImgID_10#

语音识别准确率PK

在节奏快的现代生活,语音打字也成了不少人的备用输入法。像在拥挤的公车上,想要双手打字是不太可能的,语音打字便成了不错的选择。

所以基哥也就对这5款输入法的语音准确率也进行了比较。

基哥召唤了10位小伙伴来录音,每位小伙伴分别录100个包含了聊天、搜索、中英混合场景的语料。

然后在安静环境下,5部手机连接同一无线网络,再分别用语音输入模式,识别所播放的1000条录音。最后将输入法正确识别出的字数,除以总字数,所得结果就是对应输入法的语音准确率。

从测试结果可以看出,除了苹果的系统输入法外,其他几款输入法的识别能力都还是很强的。不过,讯飞输入法和搜狗输入法,在语音输入期间,要一直按着屏幕,略显麻烦。

语音方面,基哥还测试了一下中英混合模式,毕竟我们都很international.

在中英混合模式下,苹果的系统输入法和搜狗的两款输入法,都未能完全准确的识别出句子。而百度输入法华为版的和讯飞输入法小米版的识别能力,要远比前三款强,所以基哥在这里点名表扬一下。

(原句:See you可以表示什么)

#FormatImgID_15#

手写输入准确率PK

除了拼音输入准确率和语音识别能力外,手写输入的识别能力也是考验一款输入法成熟能力的标准之一。

基哥再次请出,出镜率很高的5位小伙伴,让每位小伙伴分别在5部手机上用手写输入方式打500个常用字,记录每次手写字后,各输入法的识别结果。

搜狗的两款输入法在首选准确率和前五准确率上的差异不大,百度输入法华为版的手写首选准确率和前5准确率都是最高的。

重点是百度输入法华为版显示的书写轨迹,让基哥特别心动!就算是基哥把字写得龙飞凤舞,在百度输入法华为版显示出来的书写轨迹,却还是很整洁、很好看。

而苹果的系统输入法在手写输入这块的首选准确率要比较低,除此之外,其手写输入体验也是比较差的。由于写字区域太小,一旦书写触到选词栏,系统就都会判定为无效书写。然后基哥就得小心翼翼地慢慢写,一点都不人性化!

#FormatImgID_18#

性能PK

一款好的输入法,光是准确率高是不行的,还要速度跟得上,所以基哥决定拍一个慢动作视频,来测试一下哪家的输入法响应比较快。

一、键盘响应速度

速度测试的第一项内容就是,测试在拼音9键和26键的输入字母的响应时间。

基哥分别在5部手机的短信应用中调起面板,然后在拼音9键和26键模式下,分别输入字符输“a”,并用高速摄像机拍摄记录。再根据视频计算各输入法,从点击a后到候选字完整展现,所用的时间。

在拼音9键和26键的输入响应时间这两项中,百度输入法华为版的测试结果都是一百毫秒左右,讯飞输入法小米版的响应时间也还可以,其他的的3款的测试结果则都是在在一百五十毫秒上下。Emmmm~距离还是很明显的。

输入法打字是否流畅,除了和字母响应速度有关,气泡响应速度也是影响因素之一。

按键气泡响应的速度,是用于提醒用户是否成功输入,所以气泡的响应速度,也是会影响到我们日常的打字速度和流畅度的感受。

那基哥再用同样的记录方法,来测试一下各输入法,在做完同一点击后,气泡完全展现出来所用的时间。

这一项则是苹果的系统输入法险胜了百度输入法华为版,其他3款输入法的气泡响应速度则略微吃力。

可能有人会说,虽然这两项数据的差距很大,但在平常打字中并没有什么较大的区别。这样说是没错,但几十毫秒的差距,对基哥这种追求速度的码字一族来说,就是很大的差距了。


二、删除速度、手写识别速度

比完输入响应速度,再来比下删除速度和识别速度。

删除速度一样也很重要,像我们在日常打字的时候,一旦误触或想删除输入,都会下意识的直接按“×”键来删除,所以删除速度也是影响我们输入速度的一大关键。

还是老办法,用高速摄像机来记录,5款输入法对输入法选词栏已经有的“啊”字进行删除。从手指触到拼音9键下的“×”键,到选词栏上“啊”字被完全删除所用的时间,即为上屏删除时间。

统计完上屏删除时间,基哥再对信息框中已经有的“啊”字进行删除。计算从手指触到拼音9键下的“×”键,到“啊”字完全被删除所用的时间,所得结果即为删除上屏汉字时间。

手写识别速度则是计算5款输入法,在手写输入方式下,写完同一个字后,手指从写完字的那一帧,到输入法完全识别出该字所用的时间,就作为手写识别速度的比较依据。

看来,苹果的系统果真不是吹的,连输入法的性能都很能打。不过安卓系统里的,百度输入法华为版的性能也是优秀的,几项速度都是安卓中的第一,在手写识别速度上更是遥遥领先于其他3款。

不过基哥还是要吐槽一下苹果的系统输入法的体验,建议优化下输入法的书写轨迹,毕竟基哥写字真的没有那么难看!真的!

三、语音识别速度

接下来,基哥再来用慢镜头的方法,测试下5款手机不同输入法语音识别的速度。

评测方法是预先录制好10名用户共计500句语音,分别在同样的网络环境、相对位置的情况下,播放录音用5部手机的语音输入功能进行语音识别输入,记录从播放完录音后,到各输入法完成识别所用的时间。

百度输入法华为版在这一局,以200多毫秒的最快速度稳坐第一的宝座,讯飞输入法小米版以346毫秒紧追其后,搜狗的2款输入法和苹果的系统输入法则被远远的甩在了后面。

四、内存、CPU占比

而输入法的打字内存、后台内存、打字CPU占用率等性能,同样也是不少同学所关心的,毕竟如果内存和CPU占比过大的话,是会影响手机的流畅度的。

对此基哥专门用测试APP测试了一下。

看到测试结果后,基哥不得不夸一下百度输入法华为版,居然能在4项测试全面领跑,加个鸡腿表扬一下。

近几年来,输入法越来越智能化,这一番测试下来,基哥也深刻的感受到了这一点。所以基哥有个大胆的想法,什么时候能用意念输入啊,各大输入法程序员安排一下啊!

跑远了,回归正题!总的来说,这5款输入法,从准确度、速度及智能程度方面,百度输入法华为版还是比较让基哥心水的,除了各项成绩优异外,体验感也是几款里面最好的,所以深得基哥的心。

而苹果的系统输入法,虽然在整句准确率和删除速度上表现比较好,但是智能程度则是几款里面最差的。其他3款输入法表现平平,没有什么特别突出的,但拖后腿项倒是不少。所以经常被输入法坑害的同学,不妨往百度输入法华为版这边看一下哦!

说完了,“在看”在哪里?

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version