• 精选
  • 会员

07 为什么地球上会存在那么多不同的语言

2020年9月23日  来源:语言本能 作者:(美)史蒂芬·平克 提供人:pigu61......


目前,世界上仍有5 000多种不同的语言存在。从单词和语素的排列次序角度看,这些语言至少有45个共同点。无论哪一种语言,我们都能轻松找出几十个独特的地方。遗传、变异、隔离是导致语言差异的三大原因。在不远的将来,人类大多数语言都将彻底消失。


那时,天下人的口音、言语,都是一样。他们往东边迁移的时候,在示拿地遇见一片平原,就住在那里。他们彼此商量说:“来吧,我们要作砖。”把砖烧透了。他们就拿砖当石头,又拿石漆当灰泥。他们说:“来吧,我们要建造一座城和一座塔,塔顶通天,为要传扬我们的名,免得我们分散在全地上。”耶和华降临,要看看世人所建造的城和塔。耶和华说:“看哪,他们成为一样的人民,都是一样的言语,如今既作起这事来,以后他们所要作的事就没有不成就的了。我们下去,在那里变乱他们的口音,使他们的言语彼此不通。”于是,耶和华使他们从那里分散在全地上。他们就停工,不造那城了。因为耶和华在那里变乱天下人的言语,使众人分散在全地上,所以那城名叫巴别(就是变乱的意思)。(《创世记》11:1-9)

语言的共性与差异

1957年,语言学家马丁·朱斯(Martin Joos)对过去30年的语言学研究进行了回顾,他得出结论:事实上,上帝不仅仅变乱了诺亚子孙的语言而已。虽然《圣经·创世记》中说上帝的初衷只是为了让天下的语言互不相通,但朱斯宣称“各种语言之间的差异大到无边,而且难以预测”。然而就在同一年,乔姆斯基的著作《句法结构》(Syntactic Structures)问世,标志着“乔姆斯基革命”的到来。在接下来的30年里,我们又回到了《圣经》所记述的世界中。根据乔姆斯基的说法,如果一位来自火星的语言学家造访地球,他必然会得出这样的结论:地球上的人所说的其实是同一种语言,只不过是在词语上互不相同而已。

即使按照神学的标准来看,这种解释也是惊人之论。乔姆斯基为什么会得出这个结论呢?地球上存在着4 000~6 000种语言,无论是和英语进行比较,还是相互之间进行比较,它们看起来都是如此不同。我们可以将英语作为比照对象,说明语言之间几个最为明显的差异:

1.英语是一种“孤立”语,它是通过改变单词的排列次序来建构句子的,而单词本身缺少形式变化,例如“Dog bites man”和“Man bites dog”。而其他一些语言则通过名词的格变化,或者动词的词缀变化(与扮演角色在数量、性别以及人称上保持一致)来表示“谁对谁做了什么”。这种语言的一个典型例子是拉丁语,它是一种“屈折”语,每个词缀都包含好几种信息。而另一个例子是奇温久语,它是一种“黏着”语,每个词缀表示一种信息,而许多词缀常常串联在一起,就像我们在第4章所看到的黏着在动词上的8个词缀。

2.英语是一种“词序固定”的语言,每个短语都有固定的位置,而“词序自由”的语言则允许改变短语的顺序。澳大利亚土著的瓦勒皮里族语就是一个极端的例子,这个语言中不同短语里的单词可以随意地组合在一起:“This man speared a kangaroo”(这个人刺死了一只袋鼠)这句话可以用“Man this kangaroo speared” “Man kangaroo speared this”以及其他四种排列方式来表示,意思完全相同。

3.英语是一种“宾格”语言。在英语中,不及物动词的主语与及物动词的主语形式相同,但与及物动词的宾语形式不同,例如“She ran”(她跑)中的“she”与“She kissed Larry”(她吻了拉里)中的“she”是一样的,但与“Larry kissed her”(拉里吻了她)中的“her”不同。但在一些“作格”语言中,例如巴斯克语和澳大利亚的许多土著语言,这种分界被彻底打破了。不及物动词的主语与及物动词的宾语形式相同,而及物动词的主语则是另一种形式,就好比用“Ran her”来表示“She ran”的意思。

4.英语是一种“主语突出”的语言,所有句子都必须拥有一个主语,即便这个主语没有任何意义,例如“It is raining”(下雨了)和“There is a unicorn in the garden”(花园里有一只独角兽)。然而,在日语等“主题突出”的语言中,当前的谈话主题在句中占有一个专门的位置,例如他们会说“This place, planting wheat is good”(这个地方,种植小麦好)或者“California, climate is good”(加州,气候好)。

5.英语是一种“主动宾”语言,它的句子结构是“主语-动词-宾语”(“Dog bites man”)。而日语是“主宾动”结构(“Dog man bites”),现代爱尔兰语(盖尔语)是“动主宾”结构(“Bites dog man”)。

6. 在英语中,名词可以表示任意形式、数量的物体:“a banana”(一根香蕉)、“two bananas”(两根香蕉)、“any banana”(任何的香蕉)、“all the bananas”(所有的香蕉)。然而在“量词型”语言中,名词被分为不同的类别,例如人类、动物、无生命的物体、一维、二维、群体、工具、食物,等等。在许多语言中,人们使用的是类别的名称,而非名词本身,例如将“three hammers”(三把锤子)说成“three tools, to wit hammer”(三个用来锤东西的工具)。

当然,无论看哪一种语言,我们都能轻松地找出几十个甚至上百个独特之处。

然而另一方面,我们也可以从这些五花八门的语言中发现异常显著的共性。1963年,语言学家约瑟夫·格林伯格(Joseph Greenberg)对分布于五大洲的相隔遥远的30种语言进行了比对,其中包括塞尔维亚语、意大利语、巴斯克语、芬兰语、斯瓦希里语、柏柏尔语、土耳其语、马萨语、希伯来语、印度语、日语、缅甸语、马来语、毛利语、玛雅语、盖丘亚语(印加语的支脉)。格林伯格并非乔姆斯基学派的学者,他只是想看看这些语言是否拥有一些共同的语法特征。他第一次比对的重点是单词和语素的排列次序,结果发现了至少45个共同点。

此后,学者们开展了许多类似研究,涉及的语言来自世界各个角落,并由此发现了几百个共同点。其中一些共性是绝对的。例如,没有一种语言是通过将整个句子颠倒过来的方式来构成问句的,例如“Built Jack that house the this is?”。而有些共性则是依据统计的结果,例如几乎在所有语言中,主语都在宾语的前面,而动词则往往和它的宾语连在一起。因此,绝大多数语言都是“主动宾”或“主宾动”结构,少数语言是“动主宾”结构,“动宾主”和“宾动主”结构的语言极为稀少(小于1%),而“宾主动”结构几乎是不存在的(有几种语言被认为是“宾主动”结构,但学界对此还存在争论)。大多数语言的共性表现出“蕴涵”(implication)关系:如果一种语言有X,它也将有Y。我们在第3章中就介绍过这样一个典型的例子:如果一种语言的次序结构是“主宾动”,它的疑问词通常就出现在句尾,即后置;如果是“主动宾”结构,疑问词就出现在句首,即前置。这种普遍的蕴涵关系在语言的各个方面都有表现,无论是语音(如果一种语言有鼻元音,它必然有非鼻元音)还是语义(如果一种语言有“紫色”一词,它必然也有“红色”一词,同理,如果有“腿脚”,也必然有“胳膊”)。

如果这些共性说明语言的差异并非是随意生成的,那是否意味着语言的形式受到大脑结构的约束呢?我们并不能直接推导出这个结论。首先,我们必须排除其他两种可能的解释。

第一种解释是,人类拥有一个共同的“祖语”(proto-language),现存所有的语言都是它的后代,因此都保留了它的一些特征。这些特征在各种语言中都有相似的表现,就像希伯来语、希腊语、罗马语和斯拉夫语有着相似的字母顺序一样。这种字母顺序并无特别之处,它只是迦南人的发明创造,而西方的所有字母体系都源自于它。然而,没有语言学家会接受这种解释。首先,语言在传习过程中往往会出现断层,最极端的例子就是克里奥尔化现象,但语言的共性却适用于所有语言,包括克里奥尔语在内。其次,简单的逻辑表明,普遍的蕴涵关系,例如“如果一种语言是‘主动宾’结构,它就拥有前置词;如果是‘主宾动’结构,它就拥有后置词”, 并非像单词的认读一样是由父母传授给孩子的。就其本身的逻辑而言,蕴涵关系并不是一种英语知识。通过一定的学习,孩子们能够知道英语是“主动宾”结构,也知道它拥有前置词,但却无法了解“如果一种语言是‘主动宾’结构,它就必须拥有前置词”这个事实。普遍的蕴涵关系涉及所有语言的知识,只有从比较语言学的角度才能被揭示出来。如果一种语言在发展过程中从“主宾动”结构变成了“主动宾”结构,它的后置词也转变为前置词,那么我们就必须对此做出解释:到底是什么原因使得这两种变化保持相同的步调。

此外,假如语言的共性只是世代相传的结果,那么各种语言之间的重要区别就应当与语言谱系的分支流脉形成对应关系,就像两种文化之间的差异通常与它们各自脱离母体文化的时间相关一样。根据这种假设,当人类的祖语随着时间推移而不断分化演进时,一些分支可能变成“主宾动”结构,而另一些分支则变成“主动宾”结构;而在每一类分支中,一些语言会发展为黏着语,而另一些语言会发展为孤立语。但事实并非如此。从超过1 000年的时间跨度来看,语言的发展历史和语言的类型特征并不能完全对应。语言可以在相对较短的时间里从一种语法类型转变为另一种语法类型,并且可以在几种类型之间来回变换。除了词语之外,语言之间的差异并不会日复一日地扩大下去。例如,在不到1 000年的时间里,英语已经从一种词序自由、高度屈折、主题突出的语言(就像其姐妹语:现代德语)转变为一种词序固定、较少屈折、主语突出的语言。就某些方面而言,许多语系都包含了世界上近乎所有不同形态的语法特征。一种语言的语法特征与它在语言谱系中所处的位置缺乏明确的对应关系,这一事实表明,语言的共性并不是传说中的祖语所恰巧遗留下来的种种特征。

在将语言的共性归因于人类普遍的语言本能之前,我们还要排除第二个可能的解释:语言的共性反映的是人类思想或心智活动的共性,而并非专门的语言特征。正如我们在第2章所见,颜色词的普遍性很可能源自人类色觉的共性。主语之所以必须位于宾语前,可能是因为主语代表动作的实施者(例如“Dog bites man”),因此将主语放在前面反映的是先因后果的逻辑关系。而短语结构中的中心语前置或后置原则之所以适用于所有语言,也许是为了确保短语树形图分枝方向的一致性,无论是向左还是向右,以避免出现难以理解的“洋葱结构”。例如,日语是一种“主宾动”结构的语言,它的修饰语位于中心语的左侧,因此它的结构是“修饰语-主宾动”,修饰语位于短语之外,而非“主-修饰语-宾动”,修饰语嵌在短语内部。

但是,这种功能性的解释很难自圆其说,因为它根本无法阐明语言上的诸多共性。例如,格林伯格注意到,如果一种语言既有派生后缀(在旧词的基础上产生新词),又有屈折后缀(通过改变单词形态来满足句法要求),那么派生后缀总是比屈折后缀更接近词干。我们在第4章中曾经见识了这一原则,即合乎语法的“Darwinisms”和不合语法的“Darwinsism”。我们很难说这一原则是源自人类思想或记忆的普遍性:为什么一个达尔文提出的两种学说是可以理解的,而两个达尔文(查尔斯·达尔文和伊拉斯谟斯·达尔文)提出的一个学说却是无法理解的?除非我们根据这种语言上的表现,宣称人类心智认为“-ism”形式在认知层面上比复数形式更为基础,但这只不过是一种循环论证。又比如,在彼得·戈登的实验中,孩子们只会说“mice-eater”,而从不说“rats-eater”,尽管“rats”和“mice”的意义相同,并且这两个复合词都不会出现在大人的言谈当中。戈登的结果证明,语言的这一共性是源自大脑中词法规则的运作方式:屈折词缀可以添加到派生词上,但派生词缀却不能添加到屈折词上。

总的来说,如果要追溯巴别塔建造之前就已经存在的、源自大脑神经的普遍语法,格林伯格的比较研究并不是一个最好的方法。我们应该将语法结构作为一个整体进行考虑,而不是将它分解为一个个具体的现象。单纯地探讨一些具体现象的原因,比如“主动宾”结构,其实是只见树木不见森林。在语言共性的问题上,最值得我们关注的现象是:无论我们挑选哪一种语言作为研究对象,都可以从中找出被称为“主语”“宾语”和“动词”的东西。毕竟,如果让我们在乐谱、计算机语言、摩尔斯电码或者数学公式中寻找“主动宾”的结构顺序,我们会觉得这是荒唐之举,这就好像是将世界各地代表性的文化形态汇总起来,以调查他们的冰球队队服的颜色,或者切腹自杀的仪式。然而让我们最为惊讶的是,我们居然能够去探讨语法的普遍性!

当语言学家声称自己在各个语言中发现了相同的语言部件时,这不是因为他们事先就预料到每个语言都拥有主语,因此将其他语言中类似英语主语的这类短语也都称为“主语”;相反,当一位语言学家第一次调查某种语言时,如果他依据英语主语的某个标准(例如动作动词的施事者)将一个短语称为“主语”,他很快就会发现,其他的一些标准也同样适用于这个短语,比如它与动词在人称和数量上保持一致、位于宾语之前等。正是各种语言之间所表现出来的这些相互对应的特征,使得有关不同语言的主语、宾语、名词、动词、助动词、屈折变化的讨论具有了科学上的意义,而不是将字母表中所谓的“第2783词”和“第1491词”进行比较。

乔姆斯基表示,从火星人的角度来看,地球人说的是同一种语言。他之所以这样说,是因为他发现世界上的语言使用的都是一套相同的符号处理系统,没有任何例外。语言学家很早就知道,所有的语言都拥有一些基本的设计特征。1960年,非乔姆斯基学派的语言学家C.F.霍基特(C.F. Hockett)对人类语言和动物交流系统进行了比较,由此总结出人类语言的许多基本特征。例如:语言是以口、耳为渠道,只要使用者没有听力方面的问题(当然,对聋哑人来说,手势和表情成为一种替代渠道)。语言拥有一个通用的语法系统,它对于说话和理解同样有效,这使得说话者传达的信息都能被人理解,同时,他也能理解别人传达的信息。每个单词都有固定的含义,而单词与含义的关系是约定俗成的。语音是一组间断发出的声音。如果一个单词的读音介于“bat”和“pat”之间,这并不意味着它的意义也介于“bat”和“pat”之间。语言能够传达与说话者所处环境并无关联的抽象意义。语言的形态具有无限性,因为它们是离散组合系统的产物。所有的语言都具有“模式二重性”:一组规则规范语素中的音素,这组规则与意义无关;另一组规则规范单词和短语中的语素,并由此生成具体的意义。

乔姆斯基的语言理论,加上格林伯格的调查结果,使我们能够在这些基本特征之外发现更多的内容。可以肯定地说,我们在第3章~第5章中所分析的英语语法机制其实适用于世界上的所有语言。世界上的语言虽然都拥有成千上万的词语,但它们都可以被划分为名词、动词等不同的词性。所有单词都是依据X-杠系统组合成短语的(即名词包含在N-杠之中,而N-杠又包含在名词短语之中),短语结构的较高层级包含助动词,以表示时态、情态、体和否定。名词拥有格标记,并由心理词典中的动词或其他谓语条目分派语义角色。短语可以借助依赖于结构的移动规则,离开它在深层结构中所处的位置,从而留下一个缺口或者说语迹,由此形成问句、关系从句、被动句和其他各式各样的结构。新的单词可以依靠派生和屈折的方式来进行创造或者修饰。屈折规则主要标记名词的格和数,标记动词的时态、体、语气、语态、否定,以及与主语和宾语在数量、性别、人称上的一致性。语音的形成取决于韵律和音节的结构,以及清浊、语调、发音方式和部位等相互独立的发音特征,并最终由井然有序的音位规则进行调整。虽然从某种意义上说,这些语言上的安排大都有实际的用处,并存在于所有的人类语言之中,但却无法在计算机语言、乐谱等人工系统中被看到,这不禁留给我们一个深刻的印象:在人类的语言本能之下,存在着一种无法从历史或认知的角度进行解释的普遍语法。

上帝无须费太多的工夫就可以变乱人类的语言。除了词语的差异外(例如用不同的单词来表示“老鼠”的意思),语言中还存在一些未被普遍语法所规定的语言特征。这些特征就像参数一样,可以随意改变。例如,每种语言都可以自行选择“中心语前置”或“中心语后置”的短语结构(“eat sushi”“to Chicago”或“sushi eat”“Chicago to”);也可以自行选择主语是否必须出现,还是可以将它伺机省略。此外,某个具体的语法部件也许在某种语言扮演着重要角色,但在另一种语言中却显得无足轻重,被弃置一旁。总体来说,普遍语法就像某一门类下所有动物的原型构造图。例如,所有的两栖类、爬行类、鸟类和哺乳类动物都拥有相同的身体结构:分段的脊椎、关节灵活的四肢、尾巴、颅骨,等等。不过,其中许多部分也许已经完全变形,或者彻底退化。蝙蝠的前肢变成了翅膀,马的中趾变成了马蹄,鲸鱼的前肢变成了鳍,后肢已经完全退化,而哺乳动物中耳内的三块小骨(锤骨、砧骨和镫骨)则是由爬行动物的下颚部分进化而来。但是,无论是蝾螈还是大象,它们都有着类似的解剖学构造,例如胫骨与腿骨相连,腿骨又与髋骨相连,而它们之所以会出现诸多差异,则是因为在胚胎发育期间,它们身体的各个部分在生长时机和生长速度上存在着一些细微的区别。语言之间的差异也是如此,所有的语言似乎都有着基本相同的句法、词法和音位规则,同时也拥有一些可供选择的参数变量。一旦选定了某个参数,语言的外在形态就会随之发生极大的改变。

如果世界上的所有语言都是出自同一份设计蓝图,那么任何属于某一种语言的基本特征也应该可以在其他语言中被找到。让我们重新审视本章开篇提到的6项“非英语”的语言特征。通过仔细观察,你可以发现它们在英语中其实都有表现,而那些所谓的英语特征也可以在其他语言中找到。

1.英语虽然被认为与屈折语不同,但它同样拥有一个主谓一致的格标记,即动词的第三人称单数形式“-s”,例如“He walks”。它的代词也有格的区别,例如“he”与“him”。此外,英语和黏着语一样,也拥有一套构词规则,可以将多个部件黏合起来形成一个较长的单词,例如可以通过派生规则和添加词缀的方法创造出“sensationalization”和“Darwinianisms”。和英语比较起来,汉语是一种更为典型的孤立语,但它也拥有一套用来创建复合词和派生词的构词规则。

2.英语与“词序自由”的语言也有相同之处,它的介词短语可以自由地变换词序,每个介词都像格标记一样,标记着它的名词短语的语义角色。例如“The package was sent from Chicago to Boston by Mary” “The package was sent by Mary to Boston from Chicago”“The package was sent to Boston from Chicago by Mary”等。相反地,在那些所谓的“置乱性”语言中,词序的安排从来就没有绝对的自由。例如在瓦勒皮里族语中,助动词必须排在句子的第二个位置,这和英语倒非常相似。

3.英语和“作格”语言一样,及物动词的宾语和不及物动词的主语有着相同的形式。试比较“John broke the glass”(“glass”是宾语)和“The glass broke”(“glass”是不及物动词的主语),或者比较“Three men arrived”和“There arrived three men”。

4.英语和“主题突出”的语言一样,也为主题成分留下了一定的位置。例如:“As for fish, I eat salmon”(鱼的话,我吃大马哈鱼)和“John I never really liked”(约翰,我真的非常不喜欢)。

5.直到不久以前,英语还在使用“主宾动”的结构,因此在一些古式英语中,“主宾动”结构仍然清晰可见。例如“Till death do us part”和“With this ring I thee wed”。

6.和“量词型”语言一样,英语中的许多名词也必须与量词进行搭配。例如“一张纸”不能说成“a paper”,而必须是“a sheet of paper”。同样还有“a piece of fruit”(一个水果)、“a blade of grass”(一片草叶)、“a stick of wood”(一根木材)、“fifty head of cattle”(50头牛),等等。

导致语言差异的三大原因(遗传、变异、隔离)

如果火星上的科学家认定人类说的都是同一种语言,那么他不免会感到好奇,为什么地球上又会出现成千上万种互不相通的方言(假设这位火星人没有读过《创世记》第11章,也许基甸社[1]还没有将《圣经》送上火星)?如果语言的基本设计是先天固有的,并超越种族的界限,那它为什么不是铁板一块呢?为什么会有中心语前置或后置的参数?为什么颜色词的数量会有多有少?为什么会有所谓的波士顿口音?

地球上的科学家还没有找到最后的答案。理论物理学家弗里曼·戴森(Freeman Dyson)曾对语言多样性的原因进行了解释:“这是大自然促使我们快速进化的方式。”大自然将不同的族群隔离开来,以确保其生理和文化上的纯粹性,使之可以更为迅速地进化。但是,戴森的进化理论存在一定的缺陷。种族进化是缺乏远见的,它所考虑的是如何适应眼前所处的环境,而不会为了应对一万年后的生存环境而发生改变。戴森不是第一个将语言的多样性归因于某种目的的人。曾经有位语言学家询问一个生活于哥伦比亚的印第安人:“为什么世界上会有那么多的语言?”这位印第安人来自一个实行族外婚的部落,他的回答是:“如果大家都说图卡诺语的话,我们要到哪里去找老婆呢?”

作为一个土生土长的魁北克人,我可以充分证明,其实是语言的不同导致了种族身份的区别。这种影响非常普遍,结果也有好有坏,但戴森和那位印第安人的观点却将因果倒置。显然,包括中心语前置在内的一切语言参数,无疑是用来区分不同种族、划分民族界限的一种过于有效的工具,即便它真的满足了进化的需要。人类具有独特的才能,能够嗅出种族之间的细微差异,并由此确定自己厌恶的对象。例如欧裔美国人肤色浅,非裔美国人肤色深;苏斯博士(Dr. Seuss)在故事中写道:“星肚史尼奇的肚皮上有颗星,光肚史尼奇的肚皮上没有星。”只要世界上拥有不止一种语言,种族中心主义就会随之产生。而我们需要解释的是:为什么世界上会拥有不止一种语言。

达尔文对此有过一番重要的论断:

不同语言的形成和不同物种的形成,以及两者的发展都是一种逐渐的过程,其证据是异常相似的。……我们发现,不同的语言不仅由于共同的起源而彼此一致,还因为相似的形成过程而彼此类似。……语言有如生物,也可以逐类划分;既可以按照本源进行自然分类,也可以按照其他特性进行人为分类。占有优势的语言和方言广为传播,并且导致其他语言的逐渐灭绝。一种语言有如一个物种,一旦灭绝就永不会再生。

这就是说,英语与德语相似但不相同,就像狐狸和狼相似而不相同一样:英语和德语都是一种古老语言的变体,狐狸和狼也都是一个古老物种的变体。事实上,达尔文曾说自己从当时的语言学中获得了一些有关生物进化的灵感。关于这一点,我们将在本章的后面部分予以讨论。

语言的差异就像物种的差异一样,是三种演化过程长期作用的结果。第一种是“变异”,这在生物学上叫作“突变”,在语言学上叫作“革新”。第二种是“遗传”,从生物学上说,所有的物种都保留下了其祖先的变异结果,也就是基因遗传;从语言学上说,这表现为学习的能力。第三种是“隔离”,这在生物学上表现为地理因素、繁殖季节或者生殖器的解剖结构,在语言学上表现为人群的迁移或社会的分隔。对于语言和物种来说,相互隔离的群体会逐渐累积不同的变异结果,时间一长,就会出现分化。因此,要了解世界上为什么会有不止一种语言,就必须明确革新、学习和人口迁移对语言的影响。

首先让我们从学习能力说起,我希望你明白,“学习”其实并非我们所想的那样简单。许多社会学家认为,学习是人类进化的顶峰,它使得人类能够摆脱原始本能的束缚,因此学习能力是一种高级智慧的表现。但生物学的观点却有所不同,即使是细菌这样简单的生物也拥有学习能力,正如威廉·詹姆斯和乔姆斯基指出的,人类之所以拥有智慧,很可能是因为我们拥有更多的先天本能,而不是更少。学习是一种选择,例如动物的保护色或犄角。当生物所处的环境存在着某些无法预测的因素,导致预设的应对方案难以奏效时,自然就会赋予生物一些所需的能力。例如,在悬崖上筑巢的鸟类分辨不出它们的后代,因为它们无须掌握这项技能,凡是出现在它们巢里的大小、形状相当的东西肯定就是它们的后代。然而,大规模群居的鸟类却进化出一种能力,即它们可以辨认出自己的宝宝,以避免邻居的孩子偷偷钻入自己巢中。

即便某种特征最初是学习的结果,它也未必永远如此。进化论认为,当生存环境渐趋稳定之后,在选择性压力的作用下,一些后天获得的能力会逐渐变成先天的本能,这一观点已经得到计算机模拟实验的支持。如果某种能力是与生俱来的,它就可以在生物的早期阶段发展起来,以降低因为来不及学习而错失的概率。

那么,为什么孩子还需要学习语言的部分内容,而不让他们的大脑天生就装备所有的语言知识呢?从词语的角度来说,这样做是非常划算的。对于只有5~10万个基因的人类基因组来说,要进化、储存并维持6万个单词显然力不从心。而且,在人的一生当中,还有大量有关植物、动物、工具和人名的新单词会不断涌现。但是,人类为什么必须学习不同的语法呢?这样做有什么好处?没有人能给出答案,但存在着一些合理的推断。

也许我们所必须学习的那部分语言知识是一些通过简单的机制就能轻松掌握的内容,而这些机制形成于语法进化之前。例如,一种简单的学习回路就足以记录下哪些元素在前,哪些元素在后,只要我们事先通过其他一些认知模块对这些元素进行界定和识别。如果普遍语法界定了中心语和扮演角色,它们的相对顺序(中心语前置或后置)就很容易掌握。如果真是这样的话,这说明进化只是将语言的基本计算单位转化为先天的本能,它认为没有必要将所有学到的内容都改装成先天配件。计算机对进化的模拟结果显示,随着越来越多的学习性神经连接转换为先天性神经连接,二者之间的转换压力逐渐减小,因为错失学习机会的可能性越来越小。

我们必须学习部分语言的部分内容的第二个原因是,语言本身包含了一套与他人共享的代码。一个独属于个人的先天语法是毫无用处的。它就像探戈舞一样,必须两人合跳,孤掌则难鸣。但是,在繁衍后代的过程中,他人的基因组会发生突变、漂变和重组。因此,如果进化给每个人提供一套完全天生的语法系统,它很快就会与其他所有人的语法系统龃龉不合,因此还不如提供给孩子们一种学习各种语法部件的能力,使他们可以将自己的语法和外部环境所使用的语法协调起来。

造成语言差异的第二个原因是革新。它的过程一般是这样的:最初,某些地方的某些人在语言上开始和他们的邻居区别开来,随后,这种语言上的变化像传染病一样广泛传播,并流行起来,直到它变成一种时尚,从而代代相传。造成这种改变的因素很多,例如单词的新造、借用或淘汰,以及原有词义的引申。一些新兴的术语或说话方式首先是在亚文化中流行起来,然后再渗透到主流文化之中。流行语爱好者对于单词借用的具体实例非常痴迷,谈及这一点的书籍和文章也多如牛毛,不过这引不起我个人的兴趣。即便我们知道英语从日语中借用了“kimono”(和服),从西班牙语中借用了“banana”(香蕉),从美国印第安语中借用了“moccasin”(软帮鞋),这又有什么可惊讶的呢?

只有从语言本能的角度,我们才能发现语言革新的真正魅力:语言传播链中的每个节点都是人脑,它配备了一套普遍语法,总是伺机寻找语言环境中各种语言规则的例证。由于人们的口语往往含混不清,而单词和句子又存在许多歧义,所以有时人们会选择对听到的内容进行“重新分析”(reanalyze),他们会依据心理词典中另一个词条或规则来进行解释,从而偏离说话者的实际用法。

一个简单的例子是单词“orange”(橙子)。它最初的形式是“norange”,源自西班牙语的“naranja”。但在,不知在什么时候,某个颇有创意的人将“a norange”理解成了“an orange”。虽然说话者和听者的分析都是基于“anorange”这个相同的音,但是,一旦听者创造性地将自己认定的语法规则继续使用下去,这种变化就非常明显了,例如“those oranges”而不是“those noranges”。在英语中,这类变化十分常见。例如,莎士比亚就将“nuncle”一词作为“叔叔”的昵称,从而将“mine Uncle”变成了“my nuncle”。“Ned”(内德)成为“Edward”(爱德华)的昵称也是出于同样的原因。如今,许多人都会把“a whole another thing”说成“a whole nother thing”(完全两回事)。我认识一个孩子,他喜欢吃“ectarines”(nectarines,油桃)。另外还有一个名叫“Nalice”(Alice,爱丽丝)的成人,她把自己不喜欢的人都称作“nidiots”(idiots,傻瓜)。

重新分析是语言本能离散组合的创造性特点的产物,它在一定程度上既破坏了语言变化之间的相似性,也破坏了生物进化和文化进化之间的相似性。语言的诸多革新不同于基因的突变、漂变、侵蚀或借取,它们更像民间传说或者笑话,在每一次复述的过程中都得到润色、改进和重新加工。这就是为什么历史上的语法虽然变化很快,但却从不退化的原因,重新分析是语法结构取之不尽、用之不竭的源泉。同时,语法之间的差异也不一定会逐渐扩大,因为人类大脑所共有的普遍语法为语法的发展设置了既定轨道。此外,语言中的某个变化可能打破原有的平衡,引发一系列其他变化,就像多米诺骨牌一样。语言的任何部分都可以发生改变:

● 许多音位规则的出现,最初是源于某一社区的听者对快速、协同发音的口语所作的重新分析。让我们假设有这样一种方言,它缺少将“utter”中的[t]音闪化为[d]音的音位规则。一般来说,它的使用者会将[t]音发成[t]音,但是在快速说话或者有意“偷懒”的情况下,许多人都不会这样发音。结果,听者很可能会用闪音规则来解释这一现象,这导致他们(或者他们的孩子)即便在正式的场合下也会将[t]音进行闪音处理。进一步说,即便是低层级的音素也可能被重新分析。其中一个例子就是字母“v”的来源。古英语中并没有字母“v”,单词“starve”最初写作“steorfan”。但是,依据一条与近代闪音规则相类似的原则,两个元音之间的[f]音必须浊化,因此“ofer”被读作“over”。最终,听者将[v]音认定为一个独立的音素,而非[f]音的一种变体。因此我们现在就有了“over”这个单词, [v]音和[f] 音也成为了各自独立的音素。例如,现在我们能够区分单词“waver”和“wafer”,但是国王埃塞尔巴德(King Ethelbuld)却无法做到这一点。

● 反过来,支配单词发音的音位规则也可以被重新分析为构词规则,以规范单词的构造。例如,像古英语这样的日耳曼语有一条曲音(umlaut)规则,根据这条规则,如果一个后元音所紧邻的音节中包含一个前高元音,那么这个后元音也要相应地转变为前元音。例如“foot”一词的复数形式“foti”,其中的后元音[o]就变成了[e],从而与前元音[i]协调一致。然而到后来,词尾的这个“i”不再发音,这条音位规则也就无法再引发语音上的变化,英语使用者便开始对这种“o-e”变化进行重新分析,将它作为一种表示复数形式的变化规则。例如“foot-feet” “mouse-mice” “goose-geese” “tooth-teeth” “louse-lice”。

● 重新分析还可以将一个单词的两种变体(其中一个是另一个的词形变化)界定为两个独立的单词。以前的人们也许已经注意到,“oo-ee”变化规则并不适用于所有单词,而只适用于少部分单词,例如虽然“tooth”可以变成“teeth”,但“booth”却不能变成“beeth”。因此“teeth”被看成是一个独立的、与“tooth”相关联的不规则词,而并非是规则变化的结果。如今,元音的变化已经不再是一条规则,这也是为什么莱德勒的幽默故事《鸡舍狐狸》会让人发笑的原因。英语中其他一些有着远亲关系的单词也是因此产生的,例如“brother-brethren”“half-halve” “teeth-teethe” “to fall-to fell” “to rise-to raise”,甚至连“wrought”都曾被用作“work”的过去式。

● 此外,有些通常伴随其他单词一同出现的单词会逐渐残损变形,并附着于其他单词之上,从而形成一些新的构词规则。例如,时态标记很可能是从助动词而来的,就像我曾经提到的,英语中的后缀“-ed”可能是由“did”进化而来,例如“hammer-did”变为“hammered”。格标记可能源自发音含混的介词,或者由特定的动词序列变化而来。例如,假设某种语言允许“take nail hit it”这样的结构存在,那么其中的“take”可能会变形为宾格格标记“ta-”。此外,一致性标记可能是由代词转变而来的,在“John, he kissed her”这个句子中,“he”和“her”也许最终会演变为一致性词缀黏着于动词之上。

● 句法结构的出现,有可能是源于一些人们所偏爱的词序被重新分析为强制性的规则。例如,当英语中出现了格标记时,“give him a book”(给他一本书)和“give a book him”这两种句式都是可以成立的,但前者更为常见。然而在非正式的谈话中,格标记往往会被省略,这样一来,如果我们依然随意改变句子的词序,许多句子就会产生歧义。因此,更为常见的词序就被确立为句法规则。此外,另一些句法结构则可能是源于多重的重新分析。例如,“I had written a book”(我已写了一本书)这个句子最初是由“I had a book written”(我有一本写好的书)变化而来。由于英语中存在“主宾动”结构,这为重新分析提供了机会。过去分词“written”可以被重新分析成句子的主动词,而“had”则可以被重新分析成主动词的助动词,并利用相关词义建立起一个新的结构。

语言分化的第三个原因是人群的阻隔,这使得成功的语言革新无法传遍整个世界,而只能在不同的族群中累积、沉淀。虽然人们世世代代都在改造自己的语言,但改变的程度其实微不足道。绝大多数语音都原封不动地被保留了下来,发生突变的语音只占少数。多数的语法结构接受的是正确分析,而不是重新分析。由于这种整体的保守性,词语、语音以及语法方面的某些构造模式一直延续了千年之久,它们就像化石一样,揭示出早期人类大规模迁移的种种轨迹。沿着这些线索,我们可以了解人类是如何散布于世界各地、并最终形成今天的格局的。

以本书所使用的语言——现代美式英语为例,我们可以将其历史追溯到多远以前呢?答案是出人意料的远,也许是5 000年,甚至有可能是9 000年。戴夫·巴里笔下的“语言先生”曾经说道:“英语是一张由希腊语、拉丁语、盎格鲁语、克拉森语、凯尔特语以及其他许多古老民族的语言所共同编织的精美挂毯,只是这些古老的民族都有酗酒的毛病。”不过,我们对美式英语来源问题的了解比这要精确得多。下面让我们略作回顾。

王尔德[2]曾说过一句经典的话:“英国和美国是被同一种语言所分离的两个国家。”当来自英国的殖民者和移民越过大西洋,脱离了英式英语的语言环境时,这种分离就开始出现了。第一批殖民者离开英国时,英语已经出现了“巴别塔式”的分化,开始充斥着各种地方方言和阶级方言,而英国东南部中下阶层所说的英语则成为标准美式英语的种子。到18世纪,美国口音已经形成,而美国南方的口音又特别受到北爱尔兰移民的影响。在西部扩张的过程中,东部沿海所形成的方言差异也被保留了下来,但是随着拓荒者越走越远,他们的方言也逐渐混杂在一起,特别是在加利福尼亚州,因为在到达那里之前拓荒者必须跨越一大片内陆沙漠。在外来移民、人口流动、语文教育以及大众媒体等因素的作用下,尽管美式英语存在着为数不少的地区性差异,但和世界上其他同等大小的地域上所流行的语言相比,它已经能够统一了。这个过程被称为“反向巴别塔”(Babel in reverse)。人们常说欧扎克和阿巴拉契亚山区的方言是残存的伊丽莎白时代的英语,但这只是一种离奇而有趣的说法,这种说法其实是将语言误认为是文化的产物。我们常常被古老的歌谣、手缝的棉被以及橡木桶中的陈年威士忌酒所欺骗,错误地相信在被时间遗忘的山区,人们依然说着代代相传的传统语言。但是,语言并不是这样的。无论何时,无论何地,语言都在发生变化,只不过同一种语言在不同地区会以不同的方式发生变化,而且变化的内容也各不相同。因此,我们在这些方言中的确可以看到一些其他地区所罕见的英语形态,例如“afeared”“yourn”和“hisn”,以及“et”“holp”和“clome”(三者分别为“eat”“help”和“climb”的过去式)。但是,美式英语的其他方言也是如此,包括标准的美式英语在内。实际上,所谓的“美语特征”(Americanisms)都是从英国传入的,只是后来在英国本土反倒逐渐消失了,例如,过去分词“gotten”的使用,“a”在“path”和“bath”中发作前元音[a]而非后元音[ah],以及“mad”表示“生气”的意思、“fall”表示“秋天”的意思、“sick”表示“生病”的意思等。在英国人的耳朵里,它们都是令人头痛的美国腔,但它们却无一例外地源自北美殖民时代不列颠群岛上所流行的英语。

大西洋两岸的英语都发生了变化,而且远在“五月花”号扬帆起航之前就已经开始。现在所谓的标准现代英语其实是由伦敦一地的方言发展而来的,因为在17世纪,伦敦已成为英国政治和经济的中心。在接下来的几个世纪里,英语发生了一系列重大的变化,我们可以从下面几则不同版本的主祷文中看出端倪:

【现代英语】

Our Father, who is in heaven, may your name be kept holy. May your kingdom come into being. May your will be followed on earth, just as it is in heaven. Give us this day our food for the day. And forgive us our offenses, just as we forgive those who have offended us. And do not bring us to the test. But free us from evil. For the kingdom, the power, and the glory are yours forever. Amen.

我们在天上的父,愿人都尊你的名为圣。愿你的国降临,愿你的旨意行在地上,如行在天上。我们日用的饮食,今日赐给我们。免我们的债,如同我们免了人的债。不叫我们遇见试探,救我们脱离凶恶,因为国度、权柄、荣耀,全是你的,直到永远,阿门。

【早期现代英语(17世纪)】

Our father which are in heaven, hallowed be thy Name. Thy kingdom come. Thy will be done, on earth, as it is in heaven. Give us this day our daily bread. And forgive us our trespasses, as we forgive those who trespass against us. And lead us not into temptation, but deliver us from evil. For thine is the kingdom, and the power, and the glory, for ever, amen.

【中古英语(15世纪)】

Oure fadir that art in heuenes halowid be thi name, thi kyngdom come to, be thi wille don in erthe es in heuene, yeue to us this day oure bread ouir other substance, & foryeue to us oure dettis, as we forgeuen to oure dettouris, & lede us not in to temptacion: but delyuer us from yuel, amen.

【古英语(11世纪)】

Faeder ure thu the eart on heofonum, si thin nama gehalgod. Tobecume thin rice. Gewurthe in willa on eorthan swa swa on heofonum. Urne gedaeghwamlican hlaf syle us to daeg. And forgyf us ure gyltas, swa swa we forgyfath urum gyltedum. And ne gelaed thu us on contnungen ac alys us of yfele. Sothlice.

英语的发源地在靠近丹麦的北日耳曼地区,在公元后的最初几个世纪,那里生活着一批信仰异教的部族,例如盎格鲁人、撒克逊人和朱特人。公元5世纪,罗马帝国土崩瓦解,罗马军团也撤离了不列颠群岛,这些部族便乘虚而入,占领了现在被称为英格兰(即“Angle-land”,盎格鲁人的领地)的地区,将原本生活在那里的凯尔特人赶到了苏格兰、爱尔兰、威尔士以及康沃尔。从语言上来说,凯尔特人输得十分彻底,英语中已经找不到任何凯尔特语的痕迹。在公元9~11世纪之间,维京人不断入侵英格兰,但维京人的语言——古斯堪的纳维亚语,和盎格鲁-撒克逊语十分相似,因此除了单词的借用外,古英语没有发生太大的变化。

1066年,征服者威廉(William the Conqueror)入侵英格兰,并将诺曼法语带到了英格兰,它逐渐成为统治阶级所使用的语言。1200年后不久,随着盎格鲁-诺曼王国的约翰王(King John)失去了对诺曼底的控制,英语被重新确立为英格兰的专用语言。但是,法语对英语产生的影响至今仍清晰可见,它留下了成百上千个单词以及各式各样的语法规则。例如,在英语中,像“donate”(捐赠)、“vibrate”(振动)、“desist”(终止)这样的“拉丁衍生词”有着更为严格的句法规范。你可以说“give the museum a painting”(给博物馆一幅画),但却不能说“donate the museum a painting”;你可以说“shake it up”(把它摇匀),但却不能说“vibrate it up”。此外,这些单词也有自己的发音模式,拉丁衍生词大多是多音节词,重音在第二个音节上。例如“desist”(停止)、“construct”(建造)和“transmit”(传送),相比之下,它们在盎格鲁-撒克逊语中的同义词 “stop”“build”和“send”都是单音节词。拉丁衍生词也会引发许多音变,导致英语在构词和拼写上自成一派。例如“electric-electricity”和“nation-national”。拉丁衍生词普遍较长,而且当时更多地运用于诺曼征服者的政府、教堂和学校之中,因此也显得十分正式。如果使用过度,会导致行文冗长堆垛、为人诟病。例如,“The adolescents who had effectuated forcible entry into the domicile were apprehended”(那些实施非法入侵民宅行为的青少年被逮捕了)可以写成“We caught the kids who broke into the house”(我们抓住了闯入民宅的孩子)。奥威尔曾经将《圣经·传道书》中的一段文字翻成现代“官腔”,以展示拉丁化英语的拖沓无力:

【圣经原文】

I returned and saw under the sun, that the race is not to the swift, nor the battle to the strong, neither yet bread to the wise, nor yet riches to men of understanding, nor yet favour to men of skill; but time and chance happeneth to them all.

我又转念,见日光之下,快跑的未必能赢,力战的未必得胜,智慧的未必得粮食,明哲的未必得赀财,灵巧的未必得喜悦。所临到众人的,是在乎当时的机会。

【奥威尔译文】

Objective consideration of contemporary phenomena compels the conclusion that success or failure in competitive activities exhibits no tendency to be commensurate with innate capacity, but that a considerable element of the unpredictable must invariably be taken into account.

对当下现象的客观考量可以得出如下结论,在竞争活动中的成功或失败,与竞争者天赋才能的高低并无一致的倾向,一种冥冥中不可预知的力量必须被计算在内。

在中古英语时期(1100—1450),英语发生了显著变化,而这正是乔叟(Chaucer)生活的时代。起初,单词中的所有音节必须清楚地发音,包括现在拼写习惯上的“哑字母”(silent letter)。例如“make”一词原本读成两个音节。但是,位于词尾的音节逐渐弱化为央元音,就像“allow”中“a”的发音一样,并且在许多时候被完全省略了。由于词尾音节往往包含格标记,所以英语中的格也开始消失,而为了避免由此造成的歧义,英语的词序逐渐固定了下来。出于相同的原因,“of” “do” “will”和“have”等介词和助动词也脱离了其原始词义,担负起重要的语法功能。因此,在现代英语中,许多句法的产生都源于一个发音上的简单变化所导致的连锁反应。

早期现代英语是指1450 —1700年使用的英语,它也是莎士比亚和英王钦定版《圣经》所使用的语言。它的开端是15世纪中期的元音大转移,这是一场长元音的革命,它的具体起因至今仍然是一个谜。它或许是因为在当时渐趋流行的单音节词中,长元音的发音与短元音没有太多的区别,所以才出现这样一种补救措施;也可能是因为上流社会想要和下层百姓在语言上有所区别,因为此时诺曼法语已经被废弃不用。在元音大转移之前,“mouse”读作“mooce”,此后,这个古老的“oo”转变成了双元音,它留下的空位被一个类似于“oh”但舌位更高的音所填补。此外,“goose”一词在元音大转移之前读作“goce”,其中的空位也被元音“o”所填补。这个“o”音类似于“hot”中的“o”,只是发音更长一些。同理,“broken”的读音由原来的“brocken”变成了现在的样子。依据同样的演变规律,元音“ee”也转变成了双元音。例如“like”一词本来读作“leek”,后来通过引入元音“eh”的方法改变了读音。又如“geese”一词以前读作“gace”,后来加入了一个拉长并高化的“ah”音,这也使得“name”的读音由原来的“nahma”转变为现在的样子。不过,这些单词的拼写并没有随着读音的变化而变化,这就是为什么字母“a”在“cam”中是一种读法,在“came”中又是另一种读法的原因。其实在元音大转移之前,这两个“a”的读法完全相同,只不过后者的发音更长一些罢了。同理,这也解释了为什么在英语拼写体系中,许多元音都可以用不同的字母来表示,而其他的欧洲语言或“音位拼写”体系则相对更简单一些。

语言的源头

顺带一提,15世纪的英国人并不是某天早上醒来之后突然改变了元音的发音,就像将时钟拨到夏令时一样。在当时,元音大转移给人的感觉就像是目前芝加哥地区的居民普遍将“hot”念成“hat”,或者像在一些渐趋流行的新潮俚语中将“dude”发成“diiihhhoooood”一样。

如果我们再进一步地向上追溯,又是怎样的一番景象呢?盎格鲁人和撒克逊人的语言并非凭空而来,它们的源头是原始日耳曼语。在公元前的几个世纪里,有一个部族占据着欧洲北部的大部分领土,他们使用的语言就是原始日耳曼语。原始日耳曼语的西部分支后来分化出好几种语言,除了盎格鲁-撒克逊语之外,还有德语和荷兰语,以及由德语衍生的意第绪语和由荷兰语衍生出的南非荷兰语。它的北部分支则出现在斯堪的纳维亚半岛,发展出瑞典语、丹麦语、挪威语以及冰岛语。这些语言在词语上的相似性可谓一目了然,它们的语法也非常接近,比如都用后缀“-ed”表示过去时态。

这群原始日耳曼人没有在历史文献或考古遗迹中留下任何明确的印记,但是,他们却在自己所到之处留下了一个独特的记号。1786年,派驻印度的英国法官威廉·琼斯爵士(Sir William Jones)首次发现了这个记号,这实在是学术史上最伟大的发现之一。琼斯爵士当时正着手研究梵文,一种早已不再使用的语言。他这样写道:

梵语不管多么古老,它的结构都是令人惊叹的。梵语比希腊语更完美,比拉丁语更丰富,比二者更精练,但是与它们在动词词根方面和语法形式方面都有很显著的相似性。这种相似性如此显著,不可能是偶然出现的。没有一个考察这三种语言的语言学家会不相信它们同出一源,尽管这个源头可能已不复存在。同样有理由(虽然这理由的说服力不是特别强)认为,哥特语(日耳曼语)和凯尔特语尽管夹杂了迥异的方法,但还是与梵语同源。假如这里有篇幅讨论与波斯历史有关的问题,或许能把古波斯语加入同一语系。

正是下面这些亲缘关系让琼斯爵士印象深刻:


?

在众多现代语言中,我们都可以找到这类词语和语法上的相似性。其中包括:日耳曼语族、希腊语族、罗曼语族(法语、西班牙语、意大利语、葡萄牙语、罗马尼亚语)、斯拉夫语族(俄语、捷克语、波兰语、保加利亚语、塞尔维亚-克罗地亚语)、凯尔特语族(盖尔语、爱尔兰语、威尔士语、布列塔尼语)以及印度-伊朗语族(波斯语、阿富汗语、库尔德语、梵文、北印度语、孟加拉语、吉普赛人所说的罗曼语)。后来的学者又加上了安纳托利亚语族(曾经流行于土耳其境内的一些消亡的语言,包括赫梯语)、亚美尼亚语族、波罗的海语族(立陶宛语和拉脱维亚语)以及吐火罗语族(中国境内两种已经消亡的语言)。由于这些语言有着非常多的相似之处,语言学家推测它们都源自一个相同的祖语:原始印欧语。语言学家还重构了这个古老语言的语法和词语及其后代语言的演变规则。例如雅各布·格林(Jacob Grimm,《格林童话》的编纂者之一)就发现了这样一条规则:原始印欧语中的“p”和“t”在日耳曼语族中变成了“f”和“th”,比如“父亲”一词在拉丁语中是“pater”,梵文中是“piter”,而英语中则是“father”。

有关原始印欧语的推测隐含着一个令人难以置信的结论:某个古老的部族一定占领过包括大部分欧洲、土耳其、伊朗、阿富汗、巴基斯坦、印度北部、俄罗斯西部以及中国一隅在内的广阔土地。在100多年的时间里,这一想法使得无数语言学家和考古学家兴奋不已,但是迄今还无人知道这群原始印欧人的来龙去脉。通过重构词语的方法,学者们对此做了许多猜测。例如有关金属、轮式车辆、农具、家畜和植物的单词表明,印欧人生活在新石器时代晚期。而根据原始印欧语中涉及的各种自然名物的地理分布,例如有榆树和柳树等单词而没有橄榄油或棕榈树等单词,我们可以推测印欧人最初生活的领地大致是北欧内陆至俄罗斯南部。再加上一些有关族长、堡垒、马匹和武器的单词,我们眼前很自然地会浮现出这样一幅景象:一个马背上的强悍民族从自己祖先的领地出发,一路所向披靡,征服了欧洲和亚洲的广袤土地。到19世纪中期,雅利安人这个词成为印欧人的代称,德国纳粹就曾将雅利安人视为自己的祖先。然而基于更合理的考虑,考古学家将印欧人与公元前3 500年俄罗斯南部草原上的“库尔干文化”(Kurgan culture)联系了起来,库尔干族是一个最早在战争中使用马鞍的部落。

最近,考古学家科林·伦弗鲁(Colin Renfrew)提出了一个观点:印欧人的胜利依靠的不是战车,而是摇篮。根据这个极富争议的理论,印欧人在公元前7 000年左右生活于安纳托利亚(Anatolia,现在的土耳其境内),这个地方正好位于“新月沃地”(Fertile Cresent region)的边缘。在那里,印欧人成为世界上第一批农夫。农业对人口的增长有着极大的促进作用,因为土地可以养活更多的人。而这些人的子女又需要更多的土地,即便他们迁移到离父母只有几公里的地方,他们也会很快吞没掉附近相对落后的狩猎部落。考古学家认为,大约在公元前8 500年,土耳其境内就出现了农业生产,并在公元前2 500年左右扩展到爱尔兰和斯堪的纳维亚半岛。遗传学家最近发现,有一组基因特别集中于现代土耳其人身上,然而随着由巴尔干半岛向欧洲北部延伸,这组基因也在逐渐稀释。这一发现支持了人类遗传学家卢卡·卡瓦利-斯福扎(Luca Cavalli-Sforza)所提出的一个理论:农业生产的推广依靠的是农夫的迁移,而不是农业技术的传播。也就是说,狩猎部落是因为与农耕部落联姻而改行种地,而不是因为一时兴起而拿起锄头。这批人是不是印欧人,以及他们是否以相同的方式迁移到了伊朗、印度和中国,我们目前还无法回答,但这却有很大的可能性。当我们每一次用到“brother”这样的单词,或者使用“break-broke”“drink-drank”之类的不规则变化时,我们使用的都是世界上最早的农夫所留下的语言形态,正是他们引发了人类历史上最重要的事件:农业的传播。

我们同样可以对世界上的其他许多语言进行分类,把它们分为古代农耕者、掠夺者、迁徙者或游牧者的后裔所使用的语言。不过,并非所有欧洲的语言都属于印欧语系,例如芬兰语、匈牙利语和爱沙尼亚语就属于乌拉尔语系,它们和拉普兰语、萨莫耶德语以及其他一些语言一样,都源自大约7 000年前生活于俄罗斯中部的一个庞大民族所使用的语言。阿尔泰语系一般包括土耳其的主要语言、蒙古语,以及中亚和西伯利亚的大部分语言。人们还确定不了这些语言的始祖,但它们的近祖包括6世纪的某个帝国、成吉思汗建立的蒙古帝国以及后来的清朝所使用的语言。巴斯克语是语言学上的孤儿,它可能是源自一群成功抵制住印欧语扩张浪潮的岛居欧洲人所使用的语言。

亚非语系(又称闪含语系)包括阿拉伯语、希伯来语、马耳他语、柏柏尔语以及埃塞俄比亚和埃及的许多语言,其分布范围为撒哈拉非洲以及中东大部分地区。非洲其他地区的语言分为三类:克瓦桑语系包含昆申语和其他语族(以前被称为霍屯督语和布须曼语),其祖先一度统治了撒哈拉以南的大部分非洲地区;尼日尔-刚果语系包含班图语族,这是西非的农夫所使用的语言,这些农夫将科伊桑人赶到了他们现今居住的位于非洲南部和东南部的小块飞地;尼罗-撒哈拉语系,它统治了撒哈拉南部的三块广袤土地。

在亚洲,包括泰米尔语在内的达罗毗荼语系占据着印度南部以及北部的小块地区。因此,达罗毗荼语的使用者必定是印欧人入侵之前统治印度次大陆的部族后代。在黑海和里海之间,大约有40种语言属于高加索语系[3]。汉藏语系包括汉语、缅甸语和藏语。南岛语系[4]包括马达加斯加岛、印度尼西亚、马来西亚、菲律宾、新西兰(毛利)、密克罗尼西亚、美拉尼西亚、波利尼西亚以及夏威夷的语言。这些岛屿上的居民在远行和航海方面有着非凡的技艺。越南语和高棉语(柬埔寨的语言)则属于南亚语系。澳大利亚的200种土著语言构成了一个独立的语系,新几内亚的800种语言也同样自成一家,属于一个或者少数几个语系。日语和韩语看起来像语言世界里的孤儿,不过有少数语言学家将它们归属于阿尔泰语系。

美洲又是怎样的情形呢?格林伯格,也就是上文提到的那位语言共性研究的开创者,也曾对语言进行过划分。在将1 500种非洲语言划分为四类的问题上,格林伯格起到了重要的作用。最近他又宣称,美洲大陆上的200种土著语言可以分成三类,其中每一类语言都分别源自12 000年前的一支移民,他们从亚洲出发,越过白令海峡来到美洲。爱斯基摩人和阿留申人是最晚的一批移民,在他们之前是纳德内人,这批人占领了阿拉斯加和加拿大西北部的大部分土地,他们的语言包含了美国西南部的一些印第安语,例如纳瓦霍语和阿帕切语。这些观点已经被人们普遍接受,但格林伯格还认为,从哈得孙湾到火地岛之间的所有其他语言都属于同一语系:印第安语系。美洲只存在三支移民的观点最近得到了卡瓦利-斯福扎和其他学者的支持,他们研究了现代美洲土著人的基因和齿模,结果显示它们和上述三种语系形成大致的对应关系。

在这里,我们进入了一个充满争议、但也充满收获的领域。格林伯格的观点受到另外一些美洲土著语言学家的强烈批评。比较语言学是一门精益求精的学科,学者必须跟踪各种亲属语言在几百年甚至一千年间所表现出的基本差异,才能一步步地追溯出它们共同的祖先。格林伯格只是依据词语上的某些相似性,就将几十种语言归为一类,而没有仔细检查语音变化,并重建它们的原始语言。这种异端的做法让传统语言学家深感不安。作为一位实验心理语言学家,我已经习惯了反应时间和言语错误的干扰数据,因此,我并不认为格林伯格这种简单对应的做法有什么问题,尽管其数据的确包含一些随机误差。不过,令我无法接受的是,格林伯格对词语相似性的判断完全来自直觉,而不是通过统计的方法、计算出对应关系的出现概率。一个不那么挑剔的观察者总能在不同语言的词语表中找到一些相似的地方,但这并不意味着这些语言都源自一个共同的祖先。这也许只是一种巧合,比如希腊语用单词“pneu”来表示“吹”的意思,而克拉马斯语(美国俄勒冈州的一种印第安语)用“pniw”来表示这个意思;又比如在澳大利亚土著语姆巴巴姆语中,表示“狗”的单词正好是“dog”。此外,格林伯格的批评者还指出了一个严重问题,语言之间的相似性也可能是源自横向的借用,而并不一定是纵向的遗传,例如像“her negligées”“le weekend”这样的借用语。

针对语言的系属分类和史前人类的大陆分布问题,格林伯格等人还提出了一系列更为宏大、更为刺激,同时也更富争议的假说,但由于统计方法的缺失,这些假说也往往陷入窘境。例如,格林伯格和他的助手梅里特·鲁伦(Merritt Ruhlen)与俄罗斯语言学家谢尔盖·斯塔罗斯金(Sergei Starostin)、阿哈龙·多戈帕尔斯基(Aharon Dogopolsky )、维塔利·谢沃罗辛基(Vitaly Shevoroshkin)、弗拉迪斯拉夫·伊力奇-斯维特奇(Vladislav Illich-Svitych)一道,将各种语言分门别类,力图寻找出每一组语言的共同祖语。他们发现了各种原始语言之间的相似之处,包括印欧语、亚非语、达罗毗荼语、阿尔泰语、乌拉尔语、爱斯基摩-阿留申语,还包括日语、韩语等“孤儿”以及其他一些混合语种,这表明它们都出自同一个祖先,格林伯格等人将这个“原始的原始语言”(proto-proto-language)称为“诺斯特拉语”(Nostratic)。例如,在重建的原始印欧语中,“mor”(桑葚)一词与原始阿尔泰语中的“mür?”(浆果)、原始乌拉尔语中的“marja”(浆果),以及原始卡特维利语(格鲁吉亚语)中的“marcaw”(草莓)非常相似。支持诺斯特拉语假说的学者认为它们都是从诺斯特拉语词根“marja”发展而来。同样,原始印欧语中的“melg”(挤奶)一词与原始乌拉尔语中的“malge”(乳房)以及阿拉伯语中的“mlg”(吮吸)非常类似。诺斯特拉语的使用者应当是以狩猎、采摘为生,因为在语言学家所重建的1 600个单词中,没有一个是家禽、家畜或农作物的名称。在15 000年前,这个以狩猎、采摘为生的部族应该占据了欧洲、北非、北亚、东北亚、西亚以及南亚,它的发源地在中东地区。

这一学派的其他学者提出了更为大胆的“超级语系”和“超超级语系”。有的语系包含了印第安语系和诺斯特拉语,有的语系,例如汉-高语系,则包含了汉藏语系、高加索语系,或许还加上巴斯克语和纳德内语。在此基础上,斯塔罗斯金进一步将汉-高语系和印第安-诺斯特拉语系联系了起来,由此得出了一个“原始的原始的原始语言”(proto-proto-proto language),名为“SCAN语系”,它覆盖了整个欧亚大陆和美洲。南方语系则包括了南岛语系、南亚语系,以及中、泰两国的各种少数民族语言。在非洲,人们发现尼日尔-刚果语系和尼罗-撒哈拉语系存在许多共同点,由此反推出刚果-撒哈拉语系的存在。如果我们愿意接受这些语系的合并(当然,其中有些合并只是学者的一厢情愿),那么世界上的所有语言都可以归属于六大超级语系:亚欧大陆、美洲以及北非的SCAN语系,非洲撒哈拉沙漠以南地区的克瓦桑语系和刚果-撒哈拉语系,东南亚、印度以及太平洋地区的南方语系,澳大利亚语系以及新几内亚语系。

从理论上说,原始语言的地理分布应当与世界范围的人种分布形成对应关系,而卡瓦利-斯福扎和鲁伦的研究恰好印证了这一点。卡瓦利-斯福扎选取了几百名来自各个种族的实验对象,对他们基因中的微小差异进行了逐一检查。最后他宣称,通过将含有相似基因的不同种族逐级合并,就可以构建出整个人类基因的树形族谱。这个族谱的第一个分叉将撒哈拉沙漠以南地区的非洲人和世界上的其他人区分的人开来。后者又分为两支:一支是欧洲人、东北亚人(包括日本人和韩国人)、美洲印第安人;另一支则又分为两支,一支是东南亚人和太平洋岛民,另一支是澳大利亚土著和新几内亚人。这个基因族谱与学者所假设的超级语系形成十分明确的对应关系,尽管并不是完全一致。其中颇为有趣的一点是,人们通常是依据外在的面部特征和皮肤颜色来认定蒙古人种或东方人种,但这并不符合生物学上的事实。在卡瓦利-斯福扎的基因族谱中,西伯利亚人、日本人和韩国人等东北亚人与欧洲人更为接近,而与中国人、泰国人等东南亚人有较大的差异。令人惊讶的是,这种人种上的隐性分类正好符合语言上的隐性分类:日语、韩语和阿尔泰语与诺斯特拉语系中的印欧语系分在一起,而与汉语所属的汉藏语系界限分明。

通过这个假设的“基因/语言”谱系,我们可以描绘出晚期智人的发展历史。晚期智人最初起源于非洲大陆,即20万年前的“线粒体夏娃”。大约在10万年前,他们开始走出非洲,经由中东来到欧洲和亚洲,并在5万年前抵达澳大利亚、印度洋和太平洋诸岛以及美洲。遗憾的是,和语言谱系一样,这个基因族谱以及早期人类的迁徙路线图也充满争议。不过在接下来的几年里,学者们将会解开这个有趣的故事中所包含的全部谜团。

值得一提的是,虽然语言谱系和基因族谱之间存在一定的关联,但这并不表示拥有某种基因使得某些人能够更为容易地掌握某种语言。这种说法在民间流传甚广,例如一些法国人说,只有拥有高卢血统的人才能真正掌握法语名词的性别特征;又如我的希伯来文老师坚持认为,在希伯来语的学习上,班上的犹太学生天生就比非犹太学生要强。然而就语言本能而言,基因和语言的关联纯粹是一个巧合。人们将自己的基因储存于生殖腺中,并通过生殖器遗传给他们的后代;他们将语法储存在大脑之中,通过口耳相传的方式传递给自己的孩子。生殖腺和大脑都附着于同一个身体之上,因此当身体移动的时候,基因和语法也随之一起移动。根据遗传学家的发现,这是基因和语言存在关联性的唯一原因。但是我们知道,这种关联其实是非常脆弱的,因为在人口迁移或民族征服的过程中,移民的后代往往从外邦人的大脑中获得语法。毫无疑问的是,这些移民的后代在学习一种语言时,即便这种语言与他们父母的语言完全出自不同的源头,他们也不会比祖祖辈辈都使用这种语言的同龄人要差。因此,基因和语言的关联是非常粗糙的,只有在超级语系和原始人种的层面才能看出这一点。在过去的几个世纪里,殖民运动和人口迁移完全打破了超级语系和各洲居民之间的关联性,其中最鲜明的例子就是英语。如今,以英语为母语的人包含了地球上的所有次级人种。而在此之前,欧洲人就早已和他们的邻居相互通婚,相互征战,因此欧洲人的基因和语言之间已经几乎没有关联,只有非印欧语系的拉普语、马耳他语和巴斯克语留下了一些基因印记。出于同样的原因,在某些被普遍认可的语系中会出现来自不同种族的语言,例如埃塞俄比亚的黑人和阿拉伯的白人所用的语言都属于亚非语系,北欧的拉普人和东方的萨摩耶德人所用的语言都属于乌拉尔语系。

谢沃罗辛基、鲁伦和其他学者将这种大胆推测发挥到了极致,他们一直试图重构这六大超级语系的单词词源,即“非洲夏娃”所使用的“原世界语”(Proto-World)的词语。鲁伦推断出了31个词根,例如表示“一”的“tik”,它后来进化成原始印欧语中的“deik”(指向)、拉丁语中的“digit”(手指)、尼罗-撒哈拉语系中的“dik”(一)、爱斯基摩语中的“tik”(食指)、克德语中的“tong”(手臂)、原始亚非语中的“tak”(一)以及南亚语系中的“ktig”(手或手臂)。即便缺乏充分的统计数据,我依然愿意抽出一个空闲的下午来了解有关诺斯拉特语和其他语系的假设,但是,对于“原世界语”的假设,我抱着十分怀疑的态度,比较语言学家对此更是不屑一顾。这并不是说我怀疑人类语言起源于一时一地,这是我们寻找终极祖语的理论假设之一。我所怀疑的是,我们对单词的追溯到底有没有上限。这就好比一个人宣称自己出售的是林肯使用过的斧头,只不过多年以来这把斧头的斧面换过两次,斧柄换过三次。大多数语言学家认为,经过一万年的发展演变之后,一种语言已经不可能在它的后代中留下任何痕迹。因此,当一个人宣称自己发现了所有现代语言的近祖所留下的明确痕迹,而这个近祖又保留了20万年前人类终极祖语的痕迹,这不能不说是极其可疑的事情。

令人担忧的未来:大多数语言都将消失

我不得不以一个令人痛心的紧急呼吁来为本章画上句号。语言是通过孩子的学习而代代相传的,当语言学家发现一种语言只有成年人在说、在用时,他们知道这种语言已经步入末路。出于这个原因,他们对人类即将面临的一个历史悲剧提出了警告。根据语言学家迈克尔·克劳斯(Michael Krauss)的预测,目前有150种北美印第安语濒临消亡,这个数字占到现存北美印第安语的80%。而其他地区的形势也同样严峻:阿拉斯加和北西伯利亚的濒危语言有40种(占现存量的90%),中美洲和南美洲有160种(占现存量的23%),俄罗斯有45种(占现存量的70%),澳大利亚有225种(占现存量的90%),全球大约有3 000种(占现存量的50%)。目前只有大约600种语言因为使用人数较多(10万人以上)而显得相对安全,但这也无法保证它们就一定能够存活很久。即便是乐观的估计,也将有3 600 ~5 400种语言(占全世界语言的90%)在下个世纪里濒临灭绝。

语言的大规模灭绝让人不禁联想到当前大范围的动植物灭绝,尽管动植物的生存危机还没有语言那么严重。这两种现象背后有一些共同的原因。语言的消亡是因为使用者的栖息环境遭到破坏,同样也因为种族灭绝政策、强制性的同化教育、外来人口的大量涌入以及电子媒体的轰炸(克劳斯将电子媒体称作“文化神经毒气”)。要防止某些土著语言的灭绝,我们除了要遏止导致文化消亡的社会因素和政治因素之外,还可以用这些语言来编纂教材、创作文学作品和制作电视节目。此外,我们还可以通过档案整理和延教设课的方式,保存下某些濒危语言的语法、词语、文献和声音记录。有时候,通过坚持不懈的使用,再加上大量的文献资料,足以使一种濒临消亡的语言重获生命,比如说复活于20世纪的希伯来语。

当然,就像我们不能奢望地球上的所有物种都能存活一样,我们也不能,或许也不该奢望每种语言都被保存下来。这里牵涉到十分复杂的道德问题和现实问题。语言的差异会给社会的统一造成致命的伤害。如果整整一代人都转而投身于社会的主流语言,以便谋求更好的经济条件和社会地位,我们这些局外人是否有权强迫他们不要这样做,而理由仅仅是我们觉得保留下这些古老语言是件有意思的事情?但是撇开这些复杂因素不谈,在面对世界上这3 000多种行将消亡的语言时,我们至少可以确信一点:其中许多消亡是毫无必要的,也是完全可以避免的。

人们为什么要关注濒临灭绝的语言呢?首先,对于语言学以及包含语言学在内的脑与认知科学而言,语言的多样性向我们展示了语言本能的范围和限度。想想看,如果我们的研究对象只有英语一种语言的话,我们得出的结论将会多么偏颇。其次,对于人类学和人类进化生物学而言,语言可以帮助我们追溯不同种族的历史发展和地理分布。一种语言的消亡(比如说日本原住民阿伊努人所说的阿伊努语),就像是一座珍贵的历史档案馆毁于大火,或者像地球上的某个物种灭绝于世。不过,语言的保存并不只有科学上的意义。正如克劳斯所说:“任何一种语言都是人类集体智慧独一无二的结晶,它和生命一样,神圣、无穷又神秘。”再次,语言是文化的载体,是文学和诗歌存在的基础。随着多种语言濒临消亡,我们面临着失去诸多文化遗产的危险。例如在意第绪语中,用来描述“笨蛋”的单词比爱斯基摩人用来描述“雪”的单词还多;又比如澳大利亚拉尔地尔语的变体达明语,它一共只有200个单词,你完全可以在一天之内把它们学会,但这些单词却能够表达日常对话中的所有概念。正如语言学家肯·黑尔(Ken Hale)所说:“失去一种语言给世界造成的损失不仅仅是其本身的消亡,更重要的是,它损害了世界的多样性。”

[1]?基甸社,又称“基甸国际”,1899年成立于美国,是一个专门到旅馆、医院等处放置《圣经》的组织。——译者注

[2]?应该是萧伯纳,疑原书误。——译者注

[3]?注意不要将它与“高加索人”相混淆。“高加索人”是对欧亚大陆所生活的典型白种人的非正式称呼。

[4]?南岛语系(Austronesian)与澳大利亚(Australia)没有丝毫关系,这里的“Austr”是“南部”的意思。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000