北京时间9月28日上午消息,谷歌今天宣布,网络和移动版的谷歌翻译现在使用新的神经机器翻译系统,并用于汉译英,目前,谷歌翻译应用每天翻译约1800万次。谷歌也在发布一篇关于该方法的学术论文。
此前谷歌也曾表示在谷歌翻译中使用神经网络,但具体用于实时视频翻译功能。而今年早些时候,谷歌高级研究员杰夫·迪恩(Jeff Dean)告诉VentureBeat,谷歌正致力于研究将深入学习功能更多地整合到谷歌翻译中。今天发布的就是这项工作的成果。
谷歌已经把深层神经网络整合到越来越多的应用中,包括智能即时通讯工具Google Allo和Gmail Inbox,同时也帮助谷歌更有效地运行数据中心。
就谷歌神经机器翻译(GNMT)而言,该公司正在依托八层长短期记忆递归神经网络(LSTM RNNs)。一旦神经网络得到了充分的训练,在图形处理单元(GPU)的帮助下,谷歌即可依靠最近推出的张量处理单元(TPU)对新数据加以推断。
神经机器翻译并不总是最理想的,但谷歌的研究成果在某些情况下显示出优势。
“使用者评价表明,与以前的许多语言对系统:英语?法语、英语?西班牙语和英语?汉语相比,GNMT可将翻译错误减少60%,”研究者在论文中写道。“更多的实验表明,翻译系统的译文质量接近于普通的人类译者。”
在今天发布的一篇博客文章中,谷歌大脑团队的研究科学家富国乐(Quoc Le)和麦克·舒斯特(Mike Schuster)指出,“在双语评委的帮助下,从维基百科和新闻网站选取的几种语言对样句,”翻译错误实际上下降了55-85%。
即便如此,这套系统也不完美。
“GNMT仍然可以作出翻译人员不可能犯的重大错误,如漏译和误译专有名称或罕见术语,而且,翻译句子是孤立的,没有考虑上下文或页面的语境,“富国乐和舒斯特写道。“还有很多工作要做,我们为用户服务得更好。然而,GNMT代表了一个重要的里程碑。”