巴别塔之愿:机器翻译时代下人类译员的命运
【川透社编译报道】翻译应该超越文字本身。尽管机器翻译技术正接近实现无语言障碍的梦想,但要精准传达语境和文化的细微差异,还需要跨越人类理解的高峰。
机器翻译技术已经取得了显著进展,但要尽善尽美仍然道阻且长。1
瓦斯科·佩德罗(Vasco Pedro),是Unbabel公司(一家基于人工智能的翻译平台,译者注)的首席执行官。他曾一直坚信尽管人工智能发展迅速,机器翻译要达到专业译员的水平,始终需要人类的参与。然而,当他看到其公司将最新的AI模型与人类译员进行比赛的结果时,想法改变了。他说:“当时我心想……不敢相信,我们完了,人工翻译的时代要结束了。”佩德罗预计,目前全球翻译行业约95%的工作仍依赖人类译员,但是在未来三年内人工翻译的时代将彻底结束。
AI模型的开发者持乐观态度似乎也是有道理的。机器翻译目前非常可靠,同时普及程度也很高,这让许多用户几乎都习以为常。70年前开始了计算机翻译的首次尝试,如今,从“基于规则”到“基于统计”再到“基于神经网络”发展而来的大语言模型,每一次语言模型性能的提升都推动了机器翻译的发展。
机器翻译取代人工翻译或许只是时间问题。在Unbabel的测试中,根据多维质量指标(Multidimensional Quality Metrics),如果人类译员同时精通两种语言并且擅长某一领域的翻译(例如,法律翻译),人类译员在翻译质量上仍然略胜一筹,但是这种优势非常微弱。因此,Unbabel的负责人佩德罗表示,机器翻译取代人工翻译也只是时间问题而已。此外,罗马Translated公司的老板马可·特龙贝蒂(Marco Trombetti)提出了一个不同的测试机器翻译质量的方法——Time to Edit(TTE)(该指标指的是人类译员校对机器生成的文本所需的时间。文本中的错误越多,人工校对的速度越慢,译者注)。从2017到2022年,人类译员编辑的时间从3秒/词降到2秒/词未来甚至可以降到1秒/词,这也意味着人类译员的参与度只会越来越少,只剩下一些非常规文本的翻译工作需要人类介入。
但是尽管机器翻译技术已经日趋成熟,目前仍然面临一些未解决的难题。对于“高资源”语言,也就是拥有海量数据的翻译模型来说,翻译句子已经完全不成问题,但是对于缺乏足够的数据来训练和优化翻译模型的“低资源”语言而言,翻译的准确度还需要不断提升。例如,谷歌的一个团队开发了一套为15种非洲语言提供语音翻译的系统。该系统并没有依赖于海量的音频数据进行训练,而是像儿童学习语言一样,通过将语音与书面字符序列关联起来学习识读文字。
处理长文本等复杂任务仍然是机器翻译的短板。机器翻译在模仿人类学习语言的经验方面仍有局限,它们无法完全理解目标语言的文化背景和语境。例如,机器翻译可能会“忘记”一些短语,或者在没有足够数据支持时,难以准确翻译固定搭配的短语。卡斯维尔先生(Cashwell)表示:“要实现完美的翻译,你必须具备人类水平的智能。”如果你不是一名合格的诗人,想要翻译一首俳句是十分困难的。
到底什么才是完美的翻译?长期以来,翻译界有许多关于“直译”与“意译”的讨论——即选择将句子原封不动的翻译成目标语言,还是超越语言本身传达给目标受众相同的感受。一个完美的机器翻译系统不仅仅是完成语言直接的转换,更重要的是要能够解读一些言外之意与语气变化。
德国初创公司DeepL的创始人贾雷克·库蒂洛夫斯基(Jarek Kutylowski)表示,高级翻译需要的不仅仅是理解原文本,还需要了解更多信息,例如:提出后续问题、判断是直译还是意译,以及了解翻译的目的是什么。贾雷克说道:“如果我们能看到你发送邮件的地址,了解了一些对话记录,我们就可以说,‘嘿,这个人其实是你的老板’,并据此调整翻译内容。”但是对于目前的机器翻译技术来说,实现完美的翻译还需要跨越人类智能的高峰。
实时翻译技术正在不断发展。DeepL于11月推出了一套语音翻译系统,能够为面对面的对话以及多人视频提供在线翻译。同时,Unbabel也开发了一种可以读取手腕或眉毛的小肌肉运动的设备,如果将这些运动与大语言模型(LLM)生成的文本配对,就可以实现无需说话或打字的交流。这项技术可以运用到辅助设备中帮助那些因运动神经元受损而无法自行说话的患者实现沟通。
学习语言能带来不同的文化体验。尽管翻译技术取得了突破性的进展,卡斯维尔先生仍表示学习其他语言的价值不会完全消失。他表示:“翻译工具能帮助人们探索世界,但它们只是工具。”他说:“翻译工具无法取代学习一门语言所带来的独特的人生体验,也无法真正理解他人的思维方式或者感受不同地方的文化”。【全文完】
来源:《经济学人》2024年12月14日刊 | 作者:Edwin Frank
原文标题:The Babel wish
- “巴别”一词与圣经中的巴别塔(也叫通天塔)(Tower of Babel)的故事相关联,该故事讲述了人类因语言分歧而无法完成通天塔的建造。标题中的“Babel”暗示了语言障碍和沟通困难的主题,与机器翻译试图克服语言差异、实现全球沟通的目标相呼应。 ↩︎
文章脉络还是非常清晰,能够从首段的黑体导语中看出两个观点,即翻译技术的进步与其目前存在的局限。
对译者有两个小建议:
1. 感觉文章篇幅还是比较长,或许设立为两个独立的二级标题比较好,同时对一些关键性信息加粗处理,便于读者快速抓住每部分的重点;
2. 第二部分主要是在讲翻译技术面临的一些未解决问题以及机器翻译所要达到的标准,但倒数第二段是在表达实时翻译技术的发展,总体观点和第一部分吻合,是否需要重组一下呢?
感觉这篇选择的主题紧扣我们现在所面对的大环境,引人深思,”翻译工具无法取代学习一门语言所带来的独特的人生体验,也无法真正理解他人的思维方式或者感受不同地方的文化。“。这句话真的给我很强的共鸣感。提出一点点小小的建议:逻辑可以更加紧密一些,感觉在介绍不同公司的研究成果时可以进一步优化一下逻辑结构,比如可以先从技术进展的角度阐述机器翻译的优势再讨论局限,最后再说明人类译员在当前阶段的不可替代之处。
作为翻译专业学生,这篇新闻的标题十分吸人眼球,让人想要一探究竟;在人工智能盛行的时代,新闻选题十分新颖,将翻译专业和传媒编译实践结合得恰到好处。
文章摘要简明扼要地给出了中心论点,让人读完就知道文章总体走向和结论。在此,我需要学习这则新闻的摘要: 文字不宜太多,但要做到能用一两句话就把背景,主角,因果关系和结论说清楚,同时还能在摘要当中体现出原作者和编者的立场。
通篇读完,认为编者有以下几点需要改进:
①建议可以根据文章的内容合理添加小标题,比如前三个自然段都说的是机器翻译取代人工翻译只是时间问题,是负面的。从第四自然段开始一个明显的转折,提出技术成熟的机器翻译仍面临难以解决的难题,这对人工翻译来说是正面。
②可以将一些例子或者专有名词进行高亮或者加粗,这样便于读者快速理解,同时数据和实例也可以让文章更加有说服力。
同时,我也从这篇新闻学到了很多,例如机器翻译的现状和前景,一些专业知识:Time to Edit(TTE)(该指标指的是人类译员校对机器生成的文本所需的时间。文本中的错误越多,人工校对的速度越慢);“高资源”语言:拥有海量数据的翻译模型。
让我产生共鸣,印象深刻的是最后一段的:翻译工具无法取代学习一门语言所带来的独特的人生体验,也无法真正理解他人的思维方式或者感受不同地方的文化。机器翻译固然可以提高人类沟通理解的效率,但人类语言传达的情绪、思维、文化等始终不是机器可以代替的。