年底在即,面对正在不远处“挥手”的元旦小长假和春节7天长假,很多人的心已开始蠢蠢欲动,盘算着用一场说走就走的旅行犒劳下自己。出国旅游固然潇洒,但是身处异国他乡,面对语言不通这个大问题,翻译软件“责无旁贷”地担当起现代人们出行的必备利器,不仅“说段语音”、“拍张照片”就能翻译,一些翻译软件更是“穿越古今”,译出“富贾可为吾友乎”、“吾和吾庶士伴皆惊愕”的种种神文,“神翻译”的话题一度引发网友广泛热议。
近日,曾以实物翻译、文言文翻译等功能受到网友热捧的“翻译神器”百度翻译再次更新换代,推出安卓V4.3版。新版本着重强化了多语言互译功能,将原有的36个翻译方向拓展至136个。该版本一出就引发不少用户点赞,称大有“神器在手,走遍天下都不怕”的气势。
和市面上大多数翻译类产品不同的是,最新版百度翻译打破了以中文为核心、多语言辐射的产品思维,以NLP技术(Natural Language Processing,即自然语言处理技术)突破为基础,创新地解决了一些语种语料资源稀缺的问题,迅速实现了已支持语种间的任意互译,全方位满足用户的翻译需求。
同时,新版百度翻译还增加了对美式英语和英式英语发音的选择,用户可以根据自身喜好设置相应的发音。而此前大受旅游爱好者欢迎的实用口语板块则进一步优化了用户体验,新增了复制、收藏、放大、分享四个功能,让产品更加人性化。此外,如果用户想对一个词语的意思有更深层次的理解,新版百度翻译所增加的中中释义和英英释义功能可帮你了解更多该词语相关的延展性知识。
“为了增加更多语种之间的互译可能,我们决定选择中文或英文作为中间语言,在其他语种之间架起一座‘翻译桥梁’” ,百度NLP相关负责人介绍,由于不同语种间的语料规模不一,并且一些小语种间的直接翻译模型也较小,“如果用户想要将葡萄牙语翻译成日语,通过这项中轴语技术,机器将自动从葡语——中文——日语,葡语——英文——日语等模型中识别并过滤出最优模型,进而迅速呈现最优翻译结果。”
除了扩充翻译方向,百度翻译在准确率上的把握也十分严格。百度相关技术人员介绍,“百度翻译在用户需求量最大的中英翻译上准确率远超市面上的同类产品。针对备受网友追捧的旅游翻译功能,翻译的准确程度也提升到了90%,几乎可以达到完美的沟通无国界状态。”
据了解,基于百度在NLP上的积累优势和在机器翻译领域的实际经验,百度翻译的下一步突破口将聚焦在语义理解上。NLP基于海量自然语言语料库,通过机器学习自动理解不同单词、短语和句式,模拟人脑思考过程去理解自然语言,被广泛应用在搜索引擎之中。
“不同语种之间会遇到语序排列不同、一词多义等问题,比如,中文说‘在这张桌子上有一束花’,英文则说‘There are a bunch of flowers on the table’,再比如‘看’这个词,看病、看书、看球,意思都是不一样的。”为了解决上述难题,百度翻译采用了模拟人类的循环神经网络的方式,对译文进行翻译消歧和调序,“最终目标其实就是要让机器像人脑一样去思考、去理解、去翻译。”
值得关注的是,NLP技术不仅在语言翻译中具有重大的实用价值,更是搜索引擎的核心技术之一。作为全球领先的搜索引擎,百度已将NLP技术应用于大搜索、手机助手、翻译、LBS地图等多条业务线,首个智能问答机器人“小度”更是在此项技术的支持下具有了对语言的超强理解力和对海量信息的记忆力,在江苏卫视《芝麻开门》节目中以精彩表现击败了人类选手。
在搜索核心的NLP技术上,百度NLP团队也是世界领先的技术团队之一。除了发表了大量学术论文、支持众多研究项目在学术界拥有很高知名度外,百度NLP技术相对更加接地气,注重实用性和工业价值,强调技术为产品服务。据悉,在不久的将来,百度NLP团队还将不断探索和拓宽产品思路,尝试更前瞻的技术探索,以最大限度解决用户生活中可能遇到的语言问题为目标,用“人类的语言方式和思维逻辑”打破不同语言间的交流障碍。