咿呀学语

字数:2374

新石器时代伊始,我们在现代世界能够看到的许多文化多样性的区域模式就已经确立起来了。东亚不断扩展的农业移民浪潮将水稻种植扩展到印度尼西亚甚至更远的地区,而今,这些移民的后代身上仍然携带有这一事件的遗传痕迹。正如我们早些时候看到的那样,东南亚最早的居民可能更像今天的安达曼人或塞芒人(尼格利陀人中的一支)。很有可能这些群体绝大多数都被水稻种植者的扩张浪潮吞没,他们的文化也都被纳入主流农业文化中来。同样,欧洲、美洲和非洲的狩猎—采集群体全都放弃了上旧石器时代的生活方式,转而采用新的方式养活自己。但文化的定义远远不只是饮食,它还涵盖社会传统、服装和工具制作风格、交通方式以及数以千计的其他事物。其中最为重要的一个方面就是语言。

绝大多数前往英国的美国游客很快就会注意到当地存在着大量地区性口音这一事实。如果伦敦是第一站的话,那么伦敦腔将会成为他们迎上的第一拨口音之一。即使这些游客一直练习模仿迪克·范·戴克(Dick van Dyke)的“天哪,玛丽·波平斯”[1],但有些时候,他们仍很难相信自己和英国人说的是同一种语言。我的英国妻子也会觉得跟我那些来自南方的美国朋友进行交流同样困难。还是乔治·萧伯纳(George Bernard Shaw)说得对,他注意到了美国人和英国人实际上是被同一种语言隔开的两类人群,他甚至都没算上这两个国家内部存在的种种地方性差异。口音是语言多态性的常见例子,我们在理解这些多态性时遭遇到的困难,实际上有助于揭示某种对语言变化过程的理解。语言并非铁板一块,尽管法兰西学院竭力给操各种口音的法国民众树立起某种语言规范。与组成文化的其他方面一样,不同地区的语言彼此间存在着巨大的差异。但是,这些显而易见的语言多态性嘈杂共生的局面是否也能够揭示出人类文化传播的某些信息?

从古典时代起,人们就注意到语言存在相似性,尤其是在诸如拉丁语、法语、西班牙语和希腊语等那些已经得到充分研究的欧洲语言样本中。到了18世纪,学者们的研究视野更为宽泛,日渐聚焦于亚洲、非洲和美洲的语言。例如,亚诺什·沙伊诺维奇(Janos Sajnovics)在他1770年发表的那篇晦涩难懂的论文《论匈牙利语和拉普语之同一性》里,得出了他在标题里和盘托出的结论。我们现在知道,匈牙利语和拉普语都属于乌拉尔(Uralic)语系,这样它们也就与汗特语(Khanty)、涅涅茨语(Nenets)和恩加纳桑语(Nganasan)等更加晦涩的语言联系起来了。然而,沙伊诺维奇并不知道这层更遥远的关系的存在。虽然他和许多其他学者一样,认识到了不同语言之间存有相似之处,但他却没能够对这些相似性的起源给出有说服力的解释。

在沙伊诺维奇的研究过去好几年后,人们对归属于同一语系的不同语言之间的相似性开始给出解释。在1786年皇家亚洲学会的一次演讲中,时任印度法官的威廉·琼斯爵士(Sir William Jones)指出,梵语,这种印度教的宗教语言,与希腊语和拉丁语“无论是在动词词根还是在语法形式上,都有着高度相似之处,而这种现象绝不可能是偶然形成的”。这些相似之处是如此之多,以至于他在总结中概括称,它们肯定是“来自一个共同的源头”。正是这最后的陈述成就了威廉·琼斯爵士的不朽贡献,因为他在演讲中指出了语言多样性的产生机制。琼斯认为,语言会随着时间的推移而变化,如果一组语言之间有足够多的相似性,那么它们在过去一定会有一个共同的祖先,从那里开始这些语言才彼此分离。这是对语言多样性的一种进化论解释,等着60多年后的达尔文来证明。

琼斯所描述的语言都属于印欧语系,其得名自这些语言的地理分布。印欧语系包含了140种不同的语言,从欧洲最西北部地区属于凯尔特语族的那些语言,比如盖尔语和布列塔尼语,到斯里兰卡的僧伽罗语。英语是印欧语系日耳曼语族的成员之一,但其复杂的历史纠葛使它留下了许多借自法语的词汇。显然,这是一种广泛且多样的语言集成。

时至今日,琼斯曾经提出的设想——所有的印欧语系语言都衍生自同一原始母语——已为语言学家广泛接受。事实上,它是为数不多的得到普遍承认的语系之一。对它的模型的解读被称为语言分类的遗传模式,指的是在遥远过去的某个时间点上,有一群说着古印欧语的人。而这些古印欧语,如今进化成为我们看到的各种语言。正如我们的汤谱配方一样,各种基本原材料的新增或是改良,都会产生地方性的语言学差异,这些差异最后会发展成为清晰可辨的语言。这种和DNA演化相类似的模式看上去相当明显。但是,通过基因研究,我们真的有可能去学习有关语言多样性的诸多内容,并明了全球语言当前的分布由来吗?

语言变化一直是卢卡·卡瓦利-斯福尔扎的一个重要兴趣所在,特别是它还与遗传模式相交叠。1988年他决定直接检验这个假设,就像莱文廷处理那些来自不同种族的遗传数据那样,而不是在基因和语言多样性之间做模糊的比较。他和他的同事们研究了来自全球42个群体的遗传数据,并且通过缩减这些群体标记出现的频率差异绘制出一棵关系树以描述这些群体彼此间的关系。结果表明,这棵人口基因谱系树与我们已知的不同语言之间的关系相当吻合。举例来说,印欧语系的使用者在遗传树上的分布倾向于聚作一团,非洲班图语的使用者也是如此。当然,也有明显不一致的,比如北方和南方的中国人之间存在着巨大差异(这几乎可以肯定是由于第六章中讨论的早期迁移模式造成的)。但总体来说,遗传群体和语言群体似乎高度相符。这表明遗传数据可以用于研究语言的起源和传播。

卡瓦利-斯福尔扎和他的同事们在研究中提出了两个附加说明。首先,他们正在研究的基因标记并不必然会导致语言多样性模式的出现,压根就不存在一种会强迫它的携带者使用这种语言的班图基因。相反,类似的基因标记作为血统的重要标志,反映了说这种语言的人会拥有共同历史。第二个说明是,在许多情况下,基因和语言所暗示的关系并不统一,这表明这种联系并不是绝对的。造成这种情况的原因可能是语言替代,即人们学会说一种新的语言,而没有相应的外来基因流入;或者是基因替换,即有大量的外来基因,但语言保持不变。第一种说法解释了中国北方汉族和南方汉族之间的差异。第二种说法解释了语言彼此不相干的群体之间拥有高遗传相似性这种现象,例如,说纳-德内语的美洲原住民和邻近地区说美洲印第安语系语言的美洲印第安人。如此,基因通常而言是语言相关性的重要标志,当然,那些例外情况不在此列。不管是哪种方式,遗传数据都应该有助于我们通过梳理语言扩散方式,来弄清楚不同语言之间的联系。

[1] 迪克·范·戴克是美籍好莱坞男星,在1964年的电影《欢乐满人间》(Mary Poppins)中饰演一位有伦敦腔的角色。此为电影中台词。——编者注


双刃镰寻找故乡