提防“说得通”的胡说八道
徐贲
英语维基百科的“反启蒙”词条中,有戈雅(Francisco de Goya)的一副名画,一个人趴在桌子上,像是睡着了样子,身后一群怪物正在群魔乱舞。这幅画的题目是“理性沉睡导致群魔乱舞”(The Sleep of Reason Produces Monsters, 1799)。汉语维基百科的“反启蒙”词条是用谷歌翻译直接译过来的,解说词是“休眠原因產生的怪物”。“理性沉睡”被机械地翻译成“休眠原因”。
我读一些深奥的“思想讨论”,虽然全是熟悉的“学术”字词和言语,却有类似读“休眠原因產生的怪物”的感觉,觉得是在胡说八道。戴维·贝罗斯(David Bellos)的《谷歌是怎么翻译的》(How Google Translate works)让我明白了机器翻译与某些学术语言相通的一些道理。
贝罗斯介绍说,谷歌运用的是一种与我们一般对语言理解不同的话语转换原理。它并不假设人可以使机器翻译具备“智力”,从一开始它的翻译系统就不打算从一个句子的句法或词汇中提取意义。也就是说,“它不是把某个语言表达看作需要破解其含义的东西,而是把它视为曾经说过的话”。
各种“学术”语言的使用者也在不同程度上具有这个特点,他们发表“高见”,并不需要特别有见解,有知识,也不需要有特别强的思考能力,他们只要会使用一些“曾经说过的话”就可以了。哪怕他们自己并不真的能把握(“破解”)这些话的含义,他们只要能让听者觉得他们知道这些话的含义就可以了。换句话说,他们只要能一面机械地模仿某种程式化的语言,一面在其中加进一些适当的“填料”就可以了。
谷歌翻译有强大的资料库可以提供“现成话语”的足够庞大信息,它惊人的计算能力能够在瞬间搜索网络,从文本中找到匹配的译文。它扫描的语料库包括自1957年以来欧盟24种语言的所有文件,联合国及其附属机构的用六种官方语言写成的官方文件,以及大量其他材料,从国际法院的记录到公司报告以及个人、图书馆、书商、作者和学术界在网络上刊登的以双语形式出现的所有文章和书籍。
学术人士当然用不着这么庞大的信息资料,他们只需要是某个学术小范围内“行家”就可以了,因此可以不太困难地在头脑里储存足量的“曾经说过的话”。谁的储存量较充足,谁的学术水平就会显得高一点。
写作“学术论文”也是同样的道理。1996年,纽约大学的物理学教授索卡(Alan Sokal)向著名的左派文化研究杂志《社会文本》(Social Text)投搞一篇伪科学的文章,文题为《跨越界线:通往量子力学重力理论的转换诠释学》(Transgressing the Boundaries: Toward a Transformative Hermeneutics of Quantum Gravity)。除了运用这个刊物反复出现的许多“曾经说过的话”,再加上了一些特别的“填料”。在《社会文本》刊出该文的同日,索卡声明该文是恶作剧,是“左翼套话的杂烩、阿谀奉承式的参考、无关重要的引用、完完全全的胡扯”。索卡所说的“左翼套话”(Left-wing cant)就是那种并无实质意义,却能讨好某些人的空话,一种那些人现在还正说着的“曾经说过的话”。
谷歌翻译虽然便捷,但并不精确,如果你对译文有一定的要求,那就很难满意它的翻译。谷歌翻译还经常会产生一些“胡说八道”(nonsense)的翻译,让人要么摸不着头脑,要么觉得啼笑皆非。但是,“机器产生的胡说八道通常没有人工译者的错误那么危险,你总能马上看出谷歌翻译的错误,因为它的译文完全说不通,扔掉即可”。人工译者的译文往往流畅自然、有意义,除非你能读懂原文,你根本不知道哪里是翻译出错了,因为那是“说得通”的胡说八道。
现在中国学界有一些反启蒙的论调,就是这种“说得通”的胡说八道。除非你了解“启蒙”是什么(使人成熟起来),除非你知道导致政治乌托邦的“工具理性”与启蒙的“人文理性”的区别(专制极权与民主的区别),除非你重视启蒙的自由和理性对于当代中国的思想解放作用,你不会知道某些“西方通”专家是如何在故意误译“西方启蒙”,把它说成是一种必须破除的“迷信”。(参见某教授的《现代中国必须从对西方的迷信中解放出来》)在跨文化的介绍中,可怕的不是机器误人,而是专家误导。和18世纪启蒙时代一样,今天如果我们不想看到“群魔乱舞”,最好的办法仍然还是大家一起努力,保持清醒,不要让启蒙的理性陷于昏睡。