News

B站“不靠谱”翻译大赛:机器翻译,还远不能取代人工翻译

Update Time:2024.12.21 Source: Clicks:0

 最近,一些网友发现了机翻失误带来的“乐趣”。在国内知名的弹幕视频网站bilibili上,很多up主上传了令人啼笑皆非的机器翻译视频。

网友们把一些影视剧、动漫或者其他著名场面中的台词用谷歌翻译重新加工。如果只是翻译一遍的话,可能效果还不理想——它们错得还不够精彩。于是,网友们把谷歌翻译的结果再翻译成第三种语言,然后再翻译成第四种语言,最后再用谷歌翻译回中文。
最终,在翻译了20遍之后,原本一点点的翻译瑕疵,在不同语言的译介中错上加错,变成了“丧心病狂”的不知所云。
 
《出师表》中“奉命于危难之间,尔来二十有一年矣”,被机器一翻译变得不知所云。
今天,我们整理了这些机翻失误带来的“乐趣”,与大家分享的同时,也借助英国翻译家大卫·贝洛斯在《你耳朵里有鱼吗?》中的论述,探讨译者工作的必要性及其意义。
撰文、摘编|宫子
这类颇为搞笑的视频最早是由B站的网友做出来的,而“风评被害者”则是谷歌翻译。先列几个点击量比较高的名场面翻译。
电影《夏洛特烦恼》中著名的“马冬梅”场景:
 
 
电影《对王之王》:
 
周星驰的原台词是:十室九贫凑得八两七钱六分五毫四厘尚且三心二意一等下流。翻译后则化身为金融学家……
电视剧《亮剑》中李云龙的歇后语:
 
还有些动漫作品中的台词,在谷歌翻译了20遍后,与原意截然相反。比如《冰雪奇缘》主题曲里的“Let It Go”,最后被翻译成了“放弃吧”。(原是很励志的歌曲)
 
连我们语文课本里的文言文也没有逃脱网友的魔爪。比如《桃花源记》:
 
能把“咸”翻译成“西安”,看来谷歌翻译还是有文史基础的。
比如蒲松龄的《狼》:
 
不要让语文老师看见。
再比如《岳阳楼记》被翻译成了这样:
 
 
 
朋友们,你能看出这三句的原文是什么吗?
当然,以上纯属网友们寻开心的恶搞。但它也的确体现了翻译中存在的诸多问题。
我们都知道,语言是进入其他文化的隧道——但由于其陌生性,很多时候语言也成为隧道里的黑夜,阻碍了不同国家、民族之间的交流。为此,我们需要翻译,不仅是那种商务性与实用性的,还有潜心对文化作品进行翻译的译者,借助优秀译者的工作,一个人可以在不掌握另外一门语言的情况下,尽可能地接触异国文化。
但有些时候,那些不理想的翻译带来的结果也是灾难性的。不可见的灾难性翻译多发生在学术译介中,有时候,一个哲学术语的用词不当,便可能导致读者在理解上出现偏差,或者,一首诗歌会在翻译中丧失所有魅力,仅是变成几行排列有序的、干巴巴的句子。这两种翻译灾难由于含有“不可译”的因素,几乎无法避免。比如,我们究竟要找一个什么样的词语,才能精确表达出萨特所言的“自欺”呢?类似的翻译问题只能通过阅读原文来解决。但还有另一类翻译灾难则纯属技术性灾难——因为译者在翻译过程中,几乎只是做了辞典的工作,导致翻译出来的东西既无语感,又没有语境。
我们都期待着有一天,能有最理性的人工智能翻译软件帮助我们解决语言的障碍,从而做到无碍的全球化交流。不过机器翻译究竟能做到什么地步,永远是让人质疑的。起码就今天的技术水平来看,机翻几乎是最不靠谱的选项。
除了单词和语法,我们如何理解某句话在字面意义背后的情景?机器翻译有可能达到理解文化背景的程度吗?如何为一个词在另一种语言中寻找最恰当的对应表述——如果没有的话,译者是否可以发挥创造,以打破原句为代价去传达语意?
在《你耳朵里有鱼吗?》一书中,著名翻译家、普林斯顿大学比较文学系博士大卫·贝洛斯探讨了关于翻译语境、机器翻译的起源以及文学翻译等话题,来帮助我们更好地理解翻译这项工作。
翻译难题之无对应语境
在探索和理解语言因何不同或因何相同方面,也有一段非凡的现代历史。整个19 世纪,人们都乐此不疲,寻找世界上所有语言,想要整理出各种语言之间的关系,在这棵语言“族谱树”上,每一个分支都有自己的祖先。这场引人入胜的比赛,就以上述结论为“发令枪”。但即使在欧洲旧大陆,有些语言—比如阿尔巴尼亚语—就没有任何“近亲”,它们就像肿胀的树枝一样挂在树上。只有西班牙北部和法国西南部人们会使用的巴斯克语太过独特,根本无法归入任何一个“族谱树”分支。大探险家亚历山大的哥哥威廉·冯·洪堡(Wilhelm vonHumboldt)学会了这种特别的语言,还编写了语法。
巴斯克语表示不同事物的一系列单词并没有让洪堡备感困难,真正影响他的是巴斯克语相当独特的语言结构。在洪堡看来,巴斯克语的语法正是巴斯克文化的核心和反映。所有这些观察形成了一种理论:尽管不同语言的形式各有不同,世界上每种语言都可以让人走进不同的心理世界。巴斯克语不能“降级”为法语、德语或其他语言。巴斯克语就是巴斯克语—是“巴斯克风格”的体现和根源。据洪堡观察,不同的语言就是不同的世界,世界上各种自然语言的多样性应被视为各种思维方式和工具的宝库。
 
《你耳朵里有鱼吗?》
作者:
译者:
副标题: 翻译及万物的意义
版本: 商务印书馆,2020年4月(点击书封可购买)
洪堡的论文发表之前,“其他人不像我们这样思考”的结论就已得出,但大部分人类历史都对这一结论比较轻慢。在希腊人眼里,不会说希腊语的“野蛮人”显然不会说出什么令人感兴趣的事。同样地,对于17 世纪的法国语法学家来说,其他语言几乎无法让其使用者真正思考—能做到这一点的只有拉丁语和法语。在殖民时代,人们通常认为其他语言的“差异性”体现了使用其他语言的人在智力上比不上法国人(或希腊人、罗马人等),所以表达洪堡的这种观点需要极大的勇气。
殖民扩张和征服行动让欧洲人接触到了比巴斯克语更独特的语言。其中有些散落在世界各地,毫无规律可循,但的确非常特殊。想象一下,一种语言中没有表达“左”和“右”的词,只有表达偏重基本方向某一侧的方式。比如“你西南方的那条腿上有一只苍蝇”可能表示“左腿”或者“右腿”,完全取决于对话双方面对的方向。
比如, 使用库克萨优里语(KuukThaayorre)的人(澳大利亚约克角附近)在排列有序集合的时候(比如从1 到10 的数字或从年轻到成年的面部照片),并不是按照从左到右或从右到左的顺序,而是要从东边开始排列—至于哪边是东,则取决于人类语言学家所坐桌子的朝向。
美国语言学家本杰明·李·沃尔夫(Benjamin Lee Whorf)研究学习过很多美国本土语言,有一个关于人类语言巨大差异的例子就因他而闻名于世。
在霍皮人使用的语言中,有一种被称为“证据性”语法现象。根据霍皮语语法,每个名词短语并不会过多涉及泛指或特指(“一名农民”[“a farmer”]和“那个农民”[“the farmer”]),而是取决于所涉及的人物或事物是否在讲话者的视线范围内。表示“我现在能看到的那个农民”和“我昨天看到的那个农民”的形式不同,当然,表示“你之前跟我说过的那个农民”的形式就更不一样了。因此,要想把英语句子“The farmer killed the duck”(“那个杀了鸭子的农民”)翻译成霍皮语非常难,必须要提供大量的英语句子中没有涉及的信息—比如所谓的农民是否在说话者说话时所见范围内,以及所涉及的那只鸭子是否还在附近等。当然,如果你使用霍皮语,与你交谈的对方也使用霍皮语,你们交谈的情景是鸭子或农民某一方或都没有在你们附近,你就会知道这些问题的答案,也就可以用正确的语法表达自己要说的内容。一旦“The farmer killed the duck”超出了上下文范围,就无法进行有效翻译了。
如果你走进星巴克只说要一杯“咖啡”, 那咖啡师很可能一脸茫然地看着你。于他而言,“咖啡”这个词并没有实际含义。用我们的方言讨论咖啡店用语时,表示咖啡的词有37 个。但除非你使用的是这37 个词中的某个,否则你说的话就会让人迷惑,或者带来意想不到的后果。
人造现代机器翻译的起源
现在,既然几乎所有新闻传播涉及的方面都不再由信差完成,而由电子设备完成,那么一个很自然的问题就是,为什么核心工作本身不能同样用自动翻译机完成。
虽然机器翻译仍处于起步阶段,但已经经历了多舛多变的历史。机器翻译出现的历史背景非常具有戏剧性。机器翻译并非始于明确的政治意愿,比如欧盟的语言规则等,而是始于冷战初期的恐怖氛围。当时,美国研制出了原子弹,并付诸使用。在一段时期内,美国垄断着这种可怕的武器。可这种垄断会持续多久?苏联何时可以赶超?要想推测答案,方法之一就是梳理苏联出版的所有研究性期刊,寻找相关学科技术水平的线索。期刊中使用的都是俄语。对此,美国只有两个选择:一是培养一批名副其实的俄语—英语科学翻译团队;二是发明一种可以为其完成这项工作的机器。
但要组建一支翻译人员队伍并不容易,因为这种语言并非家喻户晓的语言。1945 年的时候,没有明确的译者资源,找不到既接受过英语教育,又能读懂俄语技术信息的译者。于是,美国当局便将目光放在了机器上。
机器翻译的旅程开始之初,人们可以在电脑上存储一组单词,并按照希腊人和罗马人设计的语法等级分类,在理论上有实现的可能性(很快也就具有了现实的可能性)。同样,同时存储两组单词也不无可能,一组是俄语单词,一组是英语单词,之后告诉计算机与某个英语单词对应的俄语单词是什么。
为了做到这一点,计算机首先要知道的是某种语言的全部语法规则。必须要告诉计算机整套语法规则中都包含哪些内容。但有谁知道英语的全部语法?每种语言的学习者都很快就会发现,系统性的规则经常被某种特例推翻。每种语言的母语使用者都知道自己可以打破语法“规则”(也经常这样做)。对任何语言的语法规则进行完整描述完全是一种奢望,而非现实。这是机器翻译碰壁的两个原因之一。
第二个原因就是,即使是人类,假设是完全掌握了其语言语法规则的人类,也需要关于世界的大量知识填补某一表达的含义—而且,尚没有人知道如何让机器明白句子到底要表达的是什么。计算机无法解决的一个经典问题就是如何将正确的含义与以下两个句子中的单词相对应:“The pen is in the box”(“笔在盒子里”)以及“The box is in the pen”(“盒子在笔中”)。理解这两个句子需要对真实世界中物体的大小有所理解(比如这两个句子中表示的分别是“钢笔大小的盒子”以及“羊圈”),但这些内容无法靠字典中的单词含义和句法规则解释。
 
谷歌翻译宣传片截图。
谷歌翻译搜索的内容,其实是翻译人员数百万个劳动工时所产生的文本。但谷歌自己的宣传视频中却根本没有详述这一点。目前,谷歌翻译可以提供58 种语言的双向翻译,即3306 种不同的翻译服务,超越了人类历史有史以来的最高值。大多数翻译关系都是由谷歌翻译最先开始的—比如冰岛语→波斯语、意第绪语→越南语,等等。之前,这些语种之间并没有翻译关系存在,因此无论在网络上还是其他资料中,都没有匹配的文本。谷歌在介绍自己服务时提到,语言之间存在巨大差异,其程序可以通过扫描寻找答案,但翻译质量取决于是哪两种语言。
这份介绍中没有强调的是,谷歌翻译其实和我们一样,是世界翻译流的囚徒。如此令人钦佩的智能概率计算系统只能运用辅助跨文化交际的设备提供3306 种翻译方向:枢纽或中介语言。英语是主要的枢纽,但并不是因为谷歌的总部设在加利福尼亚。如果使用统计学方法运算,找到从未有过直接对应的两种语言的文本,就要借助与译入语和译出语均有对应的枢纽。
谷歌提供的服务让语言关系变得扁平化和多样化,似乎超出了对欧盟语言平等规则最热忱的支持者的最大期待。但谷歌翻译只能通过挖掘、确认、强调世界翻译文本电子数据库中最广为翻译的语言的中心地位,且该种语言也应该是其他所有中介语言一直使用的译入语语言。
人造如何定义理想的翻译,
尤其是在文学中
相较于其他作品类型的译者,文学作品的译者对作品的“使用情景”只有一个模糊的概念。实际上,译者们并不确定自己的作品最终能被使用。很多翻译作品(包括很多优秀作品)的销量都非常惨淡,最终消失在黑洞之中。文学翻译的真正“客户”是一位只存在于想象中的读者——每个译者在自己脑海中想象出来的读者。
这一结论是以下情况之所以出现的真正原因:涉及文化产品传输时,译者总会对自己说,我们是在创造对等的效果。
我们通常提到的翻译艺术的标准中有两个问题:“对等”和“效用”。翻译肯定有其效用。翻译可能会让读者大笑、抽泣,也可能会让读者立刻冲向图书馆,寻找更多同类书籍。
双语读者可能可以准确地判断,翻译是否完全传达了原文的内容。但无论这位读者如何聪明,如何细致,她能合理说明波德莱尔作品的德语翻译对自己的影响与波德莱尔的法语诗作有同样的影响吗?这种说法根本无法得到论证—在我看来,这种说法也不过是一串毫无意义的单词。波德莱尔的法语作品在不同的时期对我有不同的影响,显然对读者群整体有更广泛的影响。那么,翻译对等的目标又是哪种“效果”呢?
 
电影《翻译家》剧照。
文学翻译的真相是,翻译作品与其原文本无法比较,文学作品之间也无法比较,个人对小说、诗作、戏剧的阅读感受只能通过与其他读者的讨论才能得以“衡量”。译者所做的是为作品的构成单元寻找匹配内容,而非对等内容,期望匹配内容的总和可以产生新的作品,且新作品整体可以作为原作品的替代物。
运用我们用自己或其他某种语言复述内容的所有或一种方法,就可能找到匹配的内容。
至于什么是令人满意的匹配,完全是仁者见仁,智者见智的问题,永无定数。唯一可以肯定的是,匹配内容永远无法与被匹配的内容相同。
如果你想要完全一样的内容,那也并无不可。