巴别塔之愿:机器翻译时代下人类译员的命运

【川透社编译报道】翻译应该超越文字本身。尽管机器翻译技术正接近实现无语言障碍的梦想,但要精准传达语境和文化的细微差异,还需要跨越人类理解的高峰。

机器翻译技术已经取得了显著进展,但要尽善尽美仍然道阻且长1

瓦斯科·佩德罗(Vasco Pedro),是Unbabel公司(一家基于人工智能的翻译平台,译者注)的首席执行官。他曾一直坚信尽管人工智能发展迅速,机器翻译要达到专业译员的水平,始终需要人类的参与。然而,当他看到其公司将最新的AI模型与人类译员进行比赛的结果时,想法改变了。他说:“当时我心想……不敢相信,我们完了,人工翻译的时代要结束了。”佩德罗预计,目前全球翻译行业约95%的工作仍依赖人类译员,但是在未来三年内人工翻译的时代将彻底结束。

AI模型的开发者持乐观态度似乎也是有道理的。机器翻译目前非常可靠,同时普及程度也很高,这让许多用户几乎都习以为常。70年前开始了计算机翻译的首次尝试,如今,从“基于规则”到“基于统计”再到“基于神经网络”发展而来的大语言模型,每一次语言模型性能的提升都推动了机器翻译的发展。

机器翻译取代人工翻译或许只是时间问题。在Unbabel的测试中,根据多维质量指标(Multidimensional Quality Metrics),如果人类译员同时精通两种语言并且擅长某一领域的翻译(例如,法律翻译),人类译员在翻译质量上仍然略胜一筹,但是这种优势非常微弱。因此,Unbabel的负责人佩德罗表示,机器翻译取代人工翻译也只是时间问题而已。此外,罗马Translated公司的老板马可·特龙贝蒂(Marco Trombetti)提出了一个不同的测试机器翻译质量的方法——Time to Edit(TTE)(该指标指的是人类译员校对机器生成的文本所需的时间。文本中的错误越多,人工校对的速度越慢,译者注)。从2017到2022年,人类译员编辑的时间从3秒/词降到2秒/词未来甚至可以降到1秒/词,这也意味着人类译员的参与度只会越来越少,只剩下一些非常规文本的翻译工作需要人类介入。

但是尽管机器翻译技术已经日趋成熟,目前仍然面临一些未解决的难题。对于“高资源”语言,也就是拥有海量数据的翻译模型来说,翻译句子已经完全不成问题,但是对于缺乏足够的数据来训练和优化翻译模型的“低资源”语言而言,翻译的准确度还需要不断提升。例如,谷歌的一个团队开发了一套为15种非洲语言提供语音翻译的系统。该系统并没有依赖于海量的音频数据进行训练,而是像儿童学习语言一样,通过将语音与书面字符序列关联起来学习识读文字。

处理长文本等复杂任务仍然是机器翻译的短板。机器翻译在模仿人类学习语言的经验方面仍有局限,它们无法完全理解目标语言的文化背景和语境。例如,机器翻译可能会“忘记”一些短语,或者在没有足够数据支持时,难以准确翻译固定搭配的短语。卡斯维尔先生(Cashwell)表示:“要实现完美的翻译,你必须具备人类水平的智能。”如果你不是一名合格的诗人,想要翻译一首俳句是十分困难的。

到底什么才是完美的翻译?长期以来,翻译界有许多关于“直译”与“意译”的讨论——即选择将句子原封不动的翻译成目标语言,还是超越语言本身传达给目标受众相同的感受。一个完美的机器翻译系统不仅仅是完成语言直接的转换,更重要的是要能够解读一些言外之意与语气变化。

德国初创公司DeepL的创始人贾雷克·库蒂洛夫斯基(Jarek Kutylowski)表示,高级翻译需要的不仅仅是理解原文本,还需要了解更多信息,例如:提出后续问题、判断是直译还是意译,以及了解翻译的目的是什么。贾雷克说道:“如果我们能看到你发送邮件的地址,了解了一些对话记录,我们就可以说,‘嘿,这个人其实是你的老板’,并据此调整翻译内容。”但是对于目前的机器翻译技术来说,实现完美的翻译还需要跨越人类智能的高峰。

实时翻译技术正在不断发展。DeepL于11月推出了一套语音翻译系统,能够为面对面的对话以及多人视频提供在线翻译。同时,Unbabel也开发了一种可以读取手腕或眉毛的小肌肉运动的设备,如果将这些运动与大语言模型(LLM)生成的文本配对,就可以实现无需说话或打字的交流。这项技术可以运用到辅助设备中帮助那些因运动神经元受损而无法自行说话的患者实现沟通。

学习语言能带来不同的文化体验。尽管翻译技术取得了突破性的进展,卡斯维尔先生仍表示学习其他语言的价值不会完全消失。他表示:“翻译工具能帮助人们探索世界,但它们只是工具。”他说:“翻译工具无法取代学习一门语言所带来的独特的人生体验,也无法真正理解他人的思维方式或者感受不同地方的文化”。【全文完】

来源:《经济学人》2024年12月14日刊 | 作者:Edwin Frank
原文标题:The Babel wish

  1. “巴别”一词与圣经中的巴别塔(也叫通天塔)(Tower of Babel)的故事相关联,该故事讲述了人类因语言分歧而无法完成通天塔的建造。标题中的“Babel”暗示了语言障碍和沟通困难的主题,与机器翻译试图克服语言差异、实现全球沟通的目标相呼应。 ↩︎