99. 人类译员怎样才能不被人工智能替代?

字数:4699

上一节所说的隐喻的问题,其实已经牵涉到了“翻译”这个话题,因为“如何理解隐喻”这一问题,实际上就可略等于“如何将包含隐喻的语句翻译为不包含隐喻的语句”这个问题。现在,延续着上节所开启的这个话题,我们再来正面讨论一下翻译问题。

翻译活动的重要性是毋庸置疑的。我们生活在一个多元文化的世界上,在很多场合中,我们都需要把一种语言翻译成另外一种语言。但是翻译背后的哲学问题,人们在日常生活中却很少认真思考过。

我必须要指出,现在对于翻译背后的哲学问题的思考,不仅仅具有学术价值,而且也具有很强的社会关怀。随着人工智能技术的发展,很多人都在四处鼓吹,说日后我们就不需要专业的翻译人才了,因为在不久的将来,用翻译软件就可以搞定所有的翻译工作——这个想法是否靠谱?这就需要我们结合语言学和语言哲学的知识来认真思考。我本人是倾向于为这种技术乐观主义泼冷水的。我认为,目前的翻译软件,在根底上是很难克服下面的学理障碍的。

难点一:人工智能无法具有“言语行为”

很多人认为,要把翻译搞好,无非就是要掌握很大的外语的词汇量,另外,一定要精通外语的句法。不过,这话只说对了一半。母语也好,外语也罢,本质上就是一种工具——而既然是工具,它们就是用来解决生活中的一些问题的——如果一个译员不知道这些外语表达式是用来解决什么实际问题的,而只是通过书本了解到了它们的表面特征,那么,相关的翻译工作就不能成功。

下面我们就举一个例子。不少外国人在说话时有个口头禅:“You know what I mean”。如果把这话逐字逐句翻译成汉语是什么意思?就是“你知道我到底想说的是啥”。但这样说实在太啰唆了。我们得反过来思考一下,外国朋友是在怎样的语境里面使用这话的。我们不妨脑补一下这个场景:一个记者去问一个政治家一个有点敏感的问题,政治家欲言又止,话说了一半,另外一半却不想说,这时候,被问者就会用这样的一句话来搪塞问者,这就是:“You know what I mean”——意思就是说,你知道我到底意指的是啥,你就别再问了。用语言哲学的术语来说,这就叫“以言取效”,即用一句搪塞语来起到“阻止对方继续发问”的效果(请参看本书第91节对于“言语行为”的讨论)。大家只要理解了这一点,就不难设想出中国人在面对类似的语境时会说什么话。譬如,当我们中国人欲言又止的时候,会说啥?会说“你懂的”。这也就是说,“你懂的”就是对于“You know what I mean”的合适译法。

“你懂的”这句话的语法结构,自然要比“You know what I mean”这句英文原句简单多了。这就说明,翻译并不是字对字的翻译。译者要回到对象语言的使用者的生活语境里面去思考,想清楚他们是用怎样的相关语言工具去解决他们的问题的。然后,译者还需要想清楚:说元语言的人在生活中是不是会遇到类似的问题,而当他们遇到类似的问题的时候,他们又会用怎样的工具去解决这些问题?沿着这个思路,译者才能够找到比较合适的翻译方法。

——那么,目下的人工智能是否能够完成这种任务呢?答案是否定的。上面的翻译方案,已经预设翻译者自己是能够执行各式各样的言语行为的(如以言表意、以言行事、以言取效),等等——换言之,这样的人工智能体肯定就是能够具有广泛的行动能力的“通用人工智能体”。而目前主流的基于大数据的翻译软件则都是专用的人工智能程序,根本谈不上具备广泛的行动能力。这也就是说,这些软件要么只能根据对象语句的字面意思对其进行信息处理,要么只能根据历史上既有的翻译方案来邯郸学步,却根本缺乏自主设想语用场景,进行翻译创新的能力。

难点二:人工智能无法处理隐喻

翻译之难,还难在如何处理隐喻。为什么隐喻会给翻译带来麻烦?一方面当然是因为我们有时候需要动动脑子才能看出一个句子是个隐喻;另一方面更是因为不同的民族打比方的方式是有所不同的:一个民族打比方的方式,另外一个民族就可能会不理解。对于前面一个方面的麻烦,前节已经说得够多了,下面我就来举例说明第二个方面的问题。

我们知道,在我们中国人的文化里,“狗”的认知图式往往是某种“低贱的打手”之类的东西。所以,这个隐喻往往在骂人的话里出现,比如“狗眼看人低”“狼心狗肺”“狗嘴里吐不出象牙”,等等。但是,这些话若翻译成英文,英文里是不能带“狗”(dog)字的,因为英美人一想起“dog”,所立即泛起的认知图景就是“人类忠实的朋友”——故此,若在新的英文译文里出现为“dog”,此词所自带的正面意蕴就会与原句所要表达的负面意蕴产生了冲突(请参看本书第96节对于认知图式的讨论)。所以,当一名“汉译英”的译者面对“狗眼看人低”这样的汉语表达式时,就需要以同情的态度设想英美人的认知图景是什么,用他们听得懂的话来翻译对象语言表达式的意思。

但是,当下的机器翻译技术是很难做到这一点的。我不是说当下的机器翻译技术无法应对所有的隐喻表达式——实际上,这些技术是勉强能够应对“死隐喻”的,也就是那些已经被高度惯例化的,并且有固定搭配模式的隐喻。然而,对于那些尚未被高度惯例化,且翻译方案未有统一答案的隐喻来说,目下的机器翻译技术所提供的资源是有点捉襟见肘的——因为正如我前文所指出的,对于元语言与对象语言中相关表达式的认知图式的理解,需要的是一种在符号与符号所代表的感性对象之间搭桥的能力,而这种能力只有在通用人工智能技术的框架中才能完成——而目前主流的机器翻译技术都是专用人工智能技术。为了更鲜明地展现这些主流技术的局限,我在下表中就会向读者展现它们是怎么翻译上面提到的这些带“狗”的表达式的(同时,我也会给出人类译员所给出的参考答案)。请诸位看官看表-1时忍住别笑。

从下表中我们不难发现两点:(1)除了“百度翻译”对于“狼心狗肺”的英译还算马马虎虎之外,机器翻译所给出的几乎所有的答案都错了;(2)人类所给出的所有翻译方案,其实都是消除了隐喻色彩,而力求澄清原来的表达式可能给英美人士所带来的误会。很显然,这种变通的存在本身,就向我们暗示了人类译员所已经付出的脑力劳动之艰辛。基于上述观察,我想任何一个有常识的读者都不难做出这样的判断:目下主流的机器翻译程序,并不是很清楚它们所翻译的材料究竟是啥意思,而且,它们也完全不能思考——所以,它们也就无法在面对隐喻表达式时灵活做出真正意义上的变通。

表—1 对于几个牵涉到“狗”的隐喻的机器翻译方案与人类翻译方案的比对

难点三:人工智能无法形成认知图景

在提到人工智能无法应对隐喻这一点时,我已经提到了:这些翻译软件只能处理字符与字符之间的映射关系,而在此过程之中,它们是无法形成与隐喻相关的认知图景的。与之相比,当人类译员在听或者看外语的语句时,其脑海里就会浮现出相应的图景——他要先看到这幅图景是什么,才能琢磨出怎么用元语言把它说出来。

有人说这个“图景”到底是什么?我就举一个例子,日语有一个特点,主语可以变得很长。为什么主语可以变得很长?因为在日语当中,在主语和余下的部分之间有一个分隔的符号“は”(念“哇”),让听众一下子就知道哪里到哪里了。而说话人也知道这一点,所以,在构造主语的时候可以“肆无忌惮”地增加表达式的长度。

如果一个人要用日语的上述思维方式来说汉语,那就有意思了。比如,我用汉语说一个句子:“小张早上起来,梳头梳得很慢,洗澡也洗得很慢,吃饭也吃得很慢,上学的路上吊儿郎当、左顾右盼,最后进了教室,还迟到了五分钟”。这个句子应该说是体现了很典型的中文思维。但如果用“增加主语长度”这样的日语思维方式来讲这个句子的话,就有意思了。你会说:“起きてぐずぐずしていて、髪を梳く時の動作がとても遅く、そして学校に行く途中で左を見て右を見て、最後にまた5分遅刻してやっと教室に入ってきたあれはクラスメイトの張さんです。”——直译成汉语就是:那个早上起床磨磨蹭蹭的、梳头的时候动作非常迟缓的、还在上学的途中左看右看,最后又迟到了五分钟才走进教室的家伙,就是小张同学。

当然,我这样举例,多少也是有一点夸张的,真正的日本人说话,主语也不会这么长(除非是在喜剧作品里)——但尽管如此,下面这样的包含较长主语的表达式,在日语中依然是很常见的:

“サンフランシスコから帰ってきって、時差ぼけの状態で東京へ出張するある働きマンというなら、きっとあの本田さんでしょう。”(直译:那个从旧金山一回来,连时差都没倒就去东京出差的工作狂,想必就是本田先生吧!——意译:山田先生从旧金山一回来,连时差都没倒就出差去东京了,真是工作狂啊!)

看到这里,读者是不是看出一点端倪了呢?日语的主语尽管很长,但这主语里其实出现的不是专名,而是一堆摹状词(请参看本书第82节对于“专名”与“摹状词”的区分)——而专名往往是在谓述部分出现的。所以,英语与汉语句子的典型思维方式是“专名+是+抽象描述”,而日语却可以容纳这样的思维方式:“抽象描述+は(主、谓分界词)+专名+是”(日语中的“是”是放在句末的)。这两种不同的语法结构,自然就带来了说不同语言的人的不同认知图景之间的巨大差异:汉语与英语的认知图景是:先确定一个被描述的对象,然后,像在挂钩上挂包包一样,将不同的抽象的谓述加上去;日语却时常允许如下思维方式的存在:抽象的描述词先行,让它们先构成一个语义的场所,最后才亮出底牌:原来上面说的这些,都是关于小张或者山田的。换言之,对于个体的强调,在日语中被缩减到最小限度了(从这个角度看,如果用日语来表达“疼痛”的语义的话,反而更能接近维特根斯坦试图将“疼痛”去人格化的哲学方案。请参看本书第93节的讨论)。也正因为如此,部分日语专家甚至认为日语中的“は”所分隔出来的前面的语法成分不是主语,而是所谓的“主题”(topic)——因为这些成分已经失去了别的语言中的主语所具有的基本功能:成为抽象的谓述的述说对象。顺便说一句,至少在我看来,日语的这种“祛对象化”的思维方式,就使得其自然成了一种非常适合用以表述“蕴相殊”理论的语言工具(请参看本书第89节的讨论)。

上述中日认知图景之间的巨大差异,当然就为“汉译日”与“日译汉”的工作带来了巨大的挑战。具体而言,当被翻译的文本是日语时,译者需要在脑海中先涌现出日本式的降低个体凸显度的认知图景,等到吃透这幅图景以后,再考虑如何适当凸显个体的重要性,将上述的认知图景顺化为中国人能够顺利“吞咽”的新认知图景。而从汉语到日语的反向操作也要遵循同样的道理。然而,我是非常担心机器是否能处理这个问题的。譬如,目前的“百度翻译”与“机器翻译”对于那个关于“本田先生”的日语语句的翻译方案,都是建立在错误的认知图景之上的(参看下表)。具体而言,日语的原句并没有提到条件句,但相关的翻译软件都给出了“如果”这个表达,由此将一副关于事实描述的认知图景给模态化了——另外一方面,“谷歌翻译”的翻译方案还画蛇添足地增加了“您”这个主语——这或许是因为日语中省略的主语往往是关于听话人或者说话人的——但这一点恰恰暴露出“谷歌翻译”无法根据当下语句所提供的语境信息,给出一幅正常的认知图景。

表-2 对于长主语日语语句的机器翻译方案与人类翻译方案之间的对比

本节的讨论所带给我们的启发

从本节的讨论中,我们可以得到两点结论:第一,机器翻译最怕的是超出其所熟悉的套路的新奇表达式:新奇的隐喻、新奇的主—谓结构、新奇的反讽,等等。这是为啥?这是因为目下的主流机器翻译技术都是依赖于大数据所提供的各种翻译套路的,“新奇”就是反套路,就等于要了当下机器翻译技术的老命。真是“天下武功,唯新不破”。

第二,机器翻译技术还怕复杂的长句子。为何?因为长句内部的子要素之间的关系,牵涉到了说话人内部认知图景的各要素之间的微妙关系。你要将长句子捋清楚,就需要一个内感知意义上的可视化中介,以便展现对象语句所展示出来的那个微观世界是咋样的。然而,计算机是无法形成这样的一个内感知意义上的可视化中介的,遑论让这样的中介成为语言组织的参照系。计算机只能做非常抽象的句法分析,由此把一个复杂的句子平推到另外一种语言当中同样复杂的结构上,却无法根据其所看到的事实的图景,在句法层面上做大胆的修正。

讲到这里,我们就可以思考一下本节的标题所提出的问题了:机器翻译是否能够打败人类翻译呢?我认为,除非今天的机器翻译技术发生了朝向通用人工智能技术的革命化演进,上述问题的答案应当是否定的。不幸的是,今天的机器翻译技术依然是非常愚蠢的,或者说,是一种“人工愚蠢”,而不是“人工智能”——因此,即使上面所说的这种革命化的演进真的幸运地发生了,其过程也将是非常漫长的。

——不过,在写下上面这段文字之后,一种新的忧虑就立即涌上了我的心头:我不怕人工智能变得越来越智能,我担心的是人类自己变得越来越愚蠢。前面刚说了,人类打败机器的两个法宝,第一是思维的创新性,第二乃是思维的复杂与严密性——但目下的时代,却恰恰是一个贬低厚重文化、思维日趋肤浅的“小时代”。换言之,如果从现在开始,人类的词汇量越来越贫乏,越来越不能从伟大的文化传统中汲取文化营养,以至于大家都丧失了根据自己的新鲜经验创造新的语言表达式的能力,一张口就说那些缺乏真正感悟的“口水话”,那么,我们的思维套路就会被机器一一掌握,我们就会成为机器的瓮中之鳖,我们的人性与独特性都会被机器的机械性所压倒。而且,就目下的形势来看,上述这种担忧未必就是杞人忧天。不过,如果这一切真的不幸发生了,这本身就是对于人类技术史的一个巨大讽刺:人类的智慧之所以被机器所赶超,并不是因为机器变成了人,而是因为人变成了机器。


98. 这司马懿真是一条鳟鱼啊!结语 感谢你,还保持着追求理想的初心