搜狗讯飞分获IWSLT2018评测第一，到底哪个冠军更有份量

时间：2018-11-02 18:55:53 来源：互联网编辑：星辉 发表评论无障碍通道

10月31日上午，科大讯飞和搜狗两家公司几乎在同一时间，都表示自己获得了IWSLT2018国际口语机器翻译评测比赛的第一名。看到这个夺冠“撞车”的消息，让网友们不禁产生了强烈的疑惑：又不是并列第一名(搜狗明确说明了击败讯飞)，这一个比赛里为什么会有两个世界冠军呢?

随后，我们通过IWSLT2018大赛官网并对比两家的获奖新闻，终于搞懂了这个“一个冠军，各自表述”的缘由。

讯飞or搜狗，究竟谁是第一?

作为国际上最具影响力的口语机器翻译评测比赛，每年举办一次的IWSLT确实是拥有足够的地位分量，至今已经举办了15届。通过查阅名单可知，IWSLT 2018 有全球很多的机器翻译领域的研究机构参加。

地址链接如下，可自行查看：

https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

从介绍来看，本届IWSLT 2018的口语机器翻译任务，是将英语演讲语音翻译成对应的德语文本。需要注意的是，这里所谓的翻译是把语音信号翻译成目标语言文本，并非我们熟悉的文本到文本的翻译。也就是说，这个比赛所要评测的是语音翻译能力，正是之前科大讯飞曾经闹出过“人机耦合”笑话的机器翻译技术。

本届IWSLT2018评测比赛中，搜狗与讯飞是在两个不同的赛道里分别夺冠，一个叫做baseline模型赛道，一个叫做端到端(end-to-end)模型赛道。

两者虽然都是冠军，含金量的差别却很大。

对于普通用户来说，基本可以这么理解：IWSLT这场国际口语机器翻译评测大赛分为大师赛和新秀赛两个赛道。搜狗获得了baseline模型赛道的冠军，这个赛道是目前最主流的赛道，代表着实用语音翻译技术的最高水平，是本次评测的大师赛，目前市面上机器同传、翻译机等语音翻译类产品几乎都采用了类似的方法，讯飞本次也参与了这个赛道，从官方给出的成绩看，讯飞以1.6个BLEU的劣势落后搜狗位居第二位。

另一方面，科大讯飞获得第一名的端到端(end-to-end)赛道属于本次评测新设置的赛道，各方面的技术都处于初级阶段，仍在沉淀和积累中，相当于本次评测的新秀赛，新秀是否能成长为大师，仍有待长时间的检验，还无法代表行业主流水平，搜狗本次并未参加端到端赛道的评测，但其团队在之前多个技术交流中都曾透露过正在研发端到端语音翻译技术，并取得了阶段性突破，由此可推断，搜狗参与本次评测更多是检验自研的实用语音翻译技术在行业的位置。

详解两种模型的技术差异

作为目前最主流的应用技术，baseline模型对应的语音翻译方案，包含语音识别、机器翻译两大模块，采用的是多步走的流水线设计，即语音信号先输入语音识别系统(automatic speech recognition, ASR)得到源语言的识别文本，然后再将识别文本送入机器翻译系统(neural machine translation, NMT)输出目标语言的对应译文。

根据搜狗在知乎上的介绍(https://zhuanlan.zhihu.com/p/45176217)，搜狗同传系统就是baseline模型赛道对应的典型方案，整个系统共分为5个技术模块，除了语音识别、机器翻译、语音合成三大技术模块之外，还新增了语音预处理和文本预处理两大模块，确保三项技术能够更好的联合优化，真正实现1 + 1 + 1 > 3的效果。

使用流水线方案的好处是，各大技术模块可以独立优化，充分利用语音识别、机器翻译技术领域内的优化技术以及海量数据，大幅提升单点技术效果，为了更加有效的将ASR和NMT两个系统连接起来，搜狗同传系统主要进行了两方面的工作：

1) 增加了文本预处理模块处理识别文本中的识别错误、口语化表达、语气词、文本不流利、断句等问题，将处理后的文本送到文本翻译模块进行翻译，实现了语音识别和机器翻译的有效结合;

2) 训练出语音识别、机器翻译任务内最优的模型之后，引入联合训练机制，进一步提升语音翻译效果。

罗马不是一天建成的，搜狗在同传、翻译机等产品上对实用语音翻译技术的深耕和积累，在本次评测的成绩上得到了充分展现，官方公布的成绩上，我们看到搜狗以高达28的BLEU位居baseline赛道第一。

PS：BLEU是一种机器翻译自动评价的方法，是衡量方案优劣的重要指标，其数值越大意味着越准确。

官方公布的结果中，讯飞在端到端(end-to-end)赛道获得了冠军。

端到端语音翻译技术，是指绕开语音识别、机器翻译等各模块单独优化的阶段，输入语音经过神经网络变换直接输出目标语言的译文序列，并不会产生源语言的识别中间结果。其目的是将语音翻译系统简化到一个深度神经网络中，减少识别错误等带来的翻译质量下降。

要注意的是，端到端语音翻译方案目前仍然处于早期学术研究阶段，训练方法和神经网络具体结构都不成熟，同时由于(语音-目标语言译文)的数据对难以大规模采集，因此数据和模型优势无法形成有效的协同，效果提升收到很大的阻力。

现阶段，端到端(end-to-end)的方案基本没有办法进行商业使用和普及推广，但已经成为未来可能优化语音翻译效果的方案之一。以科大讯飞这次夺冠的成绩来看，仅仅得到了19.4的BLEU，与baseline模型中的效果相差甚远，基本不具备实际的推广意义和商用价值。更何况，在讯飞夺冠的端到端(end-to-end)赛道之中，一共只有四支队伍而已，像是阿里巴巴和搜狗就压根都没有进行报名参赛。这两个赛道由于训练数据量的差异，各自BLEU值不具有直接的可比性。但是在baseline赛道，相同数据量的情况下，讯飞是实实在在的败给了搜狗。

所以说，如果IWSLT国际口语机器翻译评测大赛算是一场“全明星大赛”，那么baseline模型算是“东西对抗”级别的顶级交锋。而新添加的端到端(end-to-end)项目，也只是一场非主流的新秀表演赛罢了。

由于科大讯飞在自家的获奖宣传中，有意无意的模糊了这一层技术差别。在这里，我们也并不想去论证科大讯飞的行为对错，只是单纯从技术分析的客观角度，给各位读者们分析IWSLT比赛里两个冠军的分量区别，并希望这些中国的AI企业能够凭借自身的科研实力，取得更好的成绩。

总之，从“同传造假门”到“再获世界第一”，希望科大讯飞未来的AI之路能走的踏实些吧。

12月18日，以“携光共进与智同行”为主题的2024第二届智能车载光峰会在风景秀丽的东莞松山湖悦榕庄成功举办。本次峰会由中国智能网联汽车产业创新联盟、中国汽车工业协会车用智能显示分会联合主办，华为技术有限公司承办。峰会汇聚了来自车企、标准研究、产品测评、合

在当今手机摄影日益普及的时代，一款高性能、便携的存储设备成为了众多摄影爱好者的必备之选。雷克沙推出的Professional Go PSSD，正是为了满足这一需求而设计的。这款固态硬盘不仅体积小巧，性能卓越，还具备多重安全保障，成为专业摄影用户的得力助手。雷克沙Professi

在科技日新月异的今天，每一次技术的革新都足以掀起行业的波澜，尤其是有行业领导者推出的新技术更是如此。比如在前几天的TCL QD-Mini LED新技术发布会上，凭借一系列颠覆性的创新成果，引发了行业内外的热议。在本次发布会上重磅推出的万象分区、绚彩XDR以及量子点Pro

在科技日新月异的今天，电视显示技术正经历着前所未有的大变革。Mini LED技术的快速发展不仅为电视市场注入了新的活力，更推动了画质表现的不断突破。然而，面对激烈的市场竞争，单纯依赖参数提升已难以满足消费者对于画质的极致追求。近日，TCL QD-Mini LED新技术发布

在季节更迭的轮回中，冬季已悄然降临。然而，随着气温的逐渐下降，空气也日益干燥，给人们的肌肤带来了严峻的挑战。在这样的季节里，许多人开始感受到肌肤的微妙变化，变得干燥、紧绷，甚至出现脱皮的现象。为了应对这一季节性肌肤挑战，自然阳光焕肤水润时光面膜，正是

鸿蒙风起,未来已来——云学堂鸿蒙应用入门级开发者认证开营啦!在科技飞速发展的今天,鸿蒙系统以其开放、创新、安全的特点,正逐步构建起一个全新的智能生态。从智能手机到智能家居,从穿戴设备到出行工具,鸿蒙系统的身影无处不在,它不仅为用户带来了更加流畅、智能的使用

12月18日，2024京东金榜迎来五周年盛典，备受瞩目的“百大金奖”商品榜单也正式揭晓。过去的一年里，近9亿人次通过金榜完成下单，80%的用户在不到10秒内就能找到心仪商品；超过5200个品牌金榜留名，其中超1700个品牌在上榜当月实现销售同比增长超100%。数码品类中，从智

近日，由工信部指导的2024“绽放杯”5G应用大赛全国总决赛结果在2024中国5G发展大会期间正式揭晓——中国广电、亚信科技共同建设的全球首个全量核心网下沉本地的5G风电专网项目，从众多案例中脱颖而出斩获全国一等奖!该案例是全国一等奖中唯一的风电行业案例，此前已获

这一年我们看到的中小企业关键词是拼搏与时代共舞，书写奋斗历程是同行抱团取暖，点燃希望的火种是争先与爱采购携手，成就数智转型幸会，这一年与你们同路感恩，这一路有你们相随2024爱采购「岁末家年华」温情来袭联动全国近50个城市致敬时代同行者，期待与你共绘新章!

12月14日，2024一带一路暨金砖国家技能发展与技术创新大赛之元宇宙3D数字内容设计创作赛项(中职组)全国总决赛在湖北崇阳职业技术学校圆满闭幕。大赛于12月12日开幕，围绕文博文创、轨道交通、智能制造三个主题开展，通过比赛，参赛选手可以更深刻理解3D数字化技术在社会

在这个快节奏的时代，看电影却是一个必须慢下来的过程。相信在外奔波一天，每一位电影爱好者回家观影时，内心渴求的绝不仅仅是一台简单的投影设备，而是一份由电影原色带来的真实感动。可当今家庭影院消费市场鱼龙混杂，让人眼花缭乱，什么样的设备才能真正称得上「专业

不觉已到深冬,西伯利亚的寒风早已吹遍北方,不知已下过几场大雪。千里冰封,万物冬藏,但对另一群生命来说,却无处可藏。所以和季风一同在西伯利亚起飞的,还有候鸟。和人一样,鸟儿也在冬天向往温暖宜居的南方,为了生存每年如约开启一场浩荡迁徙。各类候鸟聚群而飞,相互支撑

相信大家最近都听说了电视圈即将迎来的年末压轴大戏吧?没错，说的就是将在12月16日举行的“光生万象”2024 TCL QD-Mini LED新技术发布会!为此官方这几天连发3张倒计时海报，引来网友的纷纷猜想，作为头部电视品牌，TCL会给消费者带来怎样的突破性技术呢?在发布正式开始

转眼又到了年底，科技圈的热闹程度堪比春节!不久前就有关TCL新技术突破的消息曝光，这几天TCL也陆续官宣新技术即将发布信息，据悉，2024年TCL QD-Mini LED新技术发布会将于12月16日14:30举行!这场被誉为“光生万象”的QD-Mini LED技术发布会，无疑将成为年底科技圈的一

我们真的太激动了，打《无畏契约》有两年的时间，真没想到有一天会拿到10万元的奖金。这对于我们战队的每个人都是莫大的鼓励，有一种热爱成为专业的不真实感。感谢掠夺者电竞大赛这个舞台，感谢宏碁品牌举办这么好的赛事活动，也感谢英特尔酷睿的加持。12月14日，掠夺

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.