腾讯研究院近期公布了一项人工智能领域的创新成果——DRT-o1系列模型,该模型特别针对文学作品翻译中的比喻和隐喻处理进行了优化,旨在提升翻译质量。
长久以来,神经机器翻译(NMT)虽然在通用文本翻译上表现出色,但在面对富含修辞手法的文学作品时,尤其是涉及比喻和明喻的句子,仍难以达到理想效果。DRT-o1系列模型的推出,为解决这一难题带来了新曙光。
为了训练DRT-o1模型,腾讯研究团队从古腾堡计划中精心挑选了400本英文公共领域书籍,这些书籍中包含了577,600个句子。团队进一步筛选出63,000个含有明喻和隐喻的句子,以此作为模型的训练数据。
DRT-o1模型的核心在于其创新的多智能体框架,该框架由翻译员、顾问和评估员三个角色构成。这一设计通过三个关键步骤:关键词翻译、初步翻译和翻译精炼循环,不断迭代优化翻译结果。
以一句英文为例:“The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.” 这句话经过DRT-o1模型的翻译后,不仅准确传达了原句的字面意思,更捕捉到了其中的情感色彩和文化内涵。
为了确保翻译结果的流畅性和可读性,腾讯研究院还引入了GPT-4o对DRT-o1模型的翻译结果进行润色。DRT-o1系列包括DRT-o1-7B和DRT-o1-14B两个版本,实验结果显示,这两个版本在翻译质量上相较于传统方法有了显著提升。
腾讯研究院的这一创新成果,不仅展示了人工智能在文学翻译领域的巨大潜力,也为未来文学作品的跨文化交流提供了更多可能性。