腾讯研究院近期揭晓了一项创新成果——DRT-o1系列模型,该模型凭借独特的长思维链(CoT)技术,在文学作品翻译领域取得了突破性进展,特别是针对比喻和隐喻等复杂修辞的处理,显著提升了翻译质量。
在神经机器翻译(NMT)技术日益成熟的背景下,日常文本的翻译效率与质量均已达到较高水准。然而,文学作品,特别是富含比喻和明喻修辞的文本,仍然是翻译领域的一大难题。这些修辞往往承载着深厚的文化内涵和语境信息,简单的直译难以精准传达其深层含义。腾讯的DRT-o1系统正是为解决这一挑战而生。
为了训练这一模型,研究人员精心挑选了古腾堡计划中的400本公共领域英文书籍,并从中提取了577,600个句子。经过严格筛选,最终确定了63,000个包含比喻和隐喻的句子作为训练素材。这些句子被用于引导模型进行深度思考,从而提升其理解和翻译复杂修辞的能力。
DRT-o1模型采用了创新的多智能体框架,包括翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问则提供修改建议,评估员则根据预设的评分标准对翻译质量进行客观评价。这一流程通过反复迭代,不断优化翻译结果,直至达到预设的评分阈值或迭代次数上限。
在具体的工作流程中,模型首先识别句子中的关键词并进行翻译,然后基于源句子和关键词的双语对应关系,生成初步的翻译结果。接着,顾问对初步翻译进行评估,并提供反馈意见。评估员则根据预定义的评分标准,对翻译的整体质量进行打分。翻译员根据反馈和评分,再次提供新的翻译。这一过程循环往复,直至翻译质量达到最佳。
最终,经过深度思考的翻译结果会由GPT-4o进行进一步的润色,以确保其流畅性和可读性。这一流程产生的数据集包含了22,264个高质量的机器翻译样本。
在腾讯研究院提供的示例中,原文“The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.”中的“struck her all of a heap”是一个成语,表示某事产生了强烈的影响。DRT-o1模型通过长思维链过程,将其翻译为“母亲将双脚搭在凳子上,似乎在努力探究那个答案,那答案中女性特有的深刻性令她猛然心生震撼。”这一翻译不仅准确传达了原文的意思,还保留了原文的情感色彩。
相比之下,谷歌翻译的版本为“母亲双脚撑在凳子上,似乎想弄清楚这个答案的真相,其女性的深刻性让她大吃一惊。”而Deepl的翻译则是“母亲把脚支在凳子上,似乎想弄清这个答案的来龙去脉,而这个答案的女性化深刻性让她茅塞顿开。”虽然这两个版本也基本传达了原文的意思,但在情感表达和细腻程度上,DRT-o1的翻译显然更胜一筹。
在性能表现方面,DRT-o1系列推出了DRT-o1-7B和DRT-o1-14B两个规模版本。实验结果显示,与Qwen2.5-7B-Instruct相比,DRT-o1-7B在BLEU分数上提高了8.26分,CometScore提高了3.36分;与Qwen2.5-14B-Instruct相比,DRT-o1-14B的BLEU分数提高了7.33分,CometScore提高了1.66分。DRT-o1-7B的性能甚至超过了更大的模型QwQ-32B,BLEU分数高出7.82分,CometScore高出1.46分,充分展示了其在处理复杂语言结构方面的卓越能力。
腾讯研究院的这一创新成果,不仅为文学作品翻译领域带来了新的希望,也为人工智能技术在语言处理领域的应用开辟了新的方向。