读者通过获取大量数据就有可能成为正字法方面的专家,这也是孩子们应该阅读大量不同类型文本的重要原因之一。对于一个初级阅读者来说,每个单词都是一个独特的模式。当孩子们接触更多的单词时,他们的头脑中就会出现主要的统计模式,之后他们的理解将更为细致,从而能更好地依靠一些事实进行判断,例如st既可以作为音节的开头,也可以作为音节的结尾;tr只能作为音节的开头,而不能作为结尾;bs只能作为音节的结尾而不能作为开头;sb则只能位于音节之间(如disbar一词)。获得正字法专业知识的途径其实很简单,就是通过不断练习,从而取得越来越多的收获。通过学习获得的拼写知识是有限的,学校里关于拼写的指导通常在四年级时就会结束。想要成为下棋或者演奏大号的专家,就需要经过多年的专门练习。但是想要成为正字法方面的专家,并不需要经过多年的专门练习。不是只有特意学习正字法模式才能具备阅读能力,我们是通过阅读获得正字法的专业知识。在收集所有拼写数据的过程中,人们也享受了阅读。18
人类是统计学的学习者,其他物种也是,只是人类更擅长而已。即便人们都认为鸽子迟钝,在测试条件良好的情况下,人们也可以教它们识别出以一种字体呈现出来的26个字母。它们需要大量训练,并且需要食物的诱惑才能学习。对于鸽子的学习阅读来说,这已经足够了。19
对动物来说,行走时不会摇晃头部的狒狒在阅读方面表现更好。2012年,它们曾在阅读实验中大出风头,尽管它们自己并不知情。据报道,科学家训练了几只狒狒阅读单词。《科学》(Science)期刊曾报道狒狒可以学习辨别单词,例如区分brake与看似存在的单词brone。20在人类研究中,这种任务被称作词汇辨析(它是不是一个单词?)。
人们可以教狒狒识别一串字母(单词)。在测试阶段,研究人员将这些单词与新的字母串(非单词)混合在一起。狒狒将它们区分开的准确性是惊人的。该研究的负责人认为,该研究展现出狒狒具有学习正字法统计知识的能力,例如,它们能够将字母组合区分开来。这证明了阅读所涉及的这项能力并不是人类这种高等动物所独有的。
这类研究提出了一个新问题:动物行为是否在很大程度上与人类行为相似。在“狒狒能阅读”21这个故事震惊世人后,人们继续开展研究,并发现实验中特定的单词和非单词的统计特征有细微的差别,而这些差别是实验者所没有注意到的。一些字母更有可能出现在测试的单词中,而另一些字母则更有可能出现在非单词中,而并不愚蠢的狒狒注意到了这一点。狒狒并没有学会多字母的正字法模式,它们只是观察了这些字母出现的频率,这足以使它们在刺激下实现报道中所说的那种水平的表演。这虽然不是普通的行为,但也不是单词识别。我觉得人们也可以拿鸽子验证一下,看看鸽子将怎样做。除了人类以外,没有其他动物有能力学习文字系统中的复杂统计结构,这些狒狒则差得更多。而发现这些正字法模式象征着其他的因素,例如单词的读音和含义,则是另一个巨大的突破。
特别的正字法专业知识是另一种极端的例子。正字法领域的大师是拼字游戏比赛的选手。22拼字游戏是一种词汇辨析比赛。选手的任务是想出能填入题板的得分高的单词组合。他们必须知道什么字母组合能够组成拼字字典里的单词。他们也要能辨别哪些字母组合并不是单词,以便当对手耍把戏时,能够发现他拼写的单词并不存在,而是将非单词的字母组合伪装成了真实存在的单词。为了达到最高的技术水平,比赛的选手们需要研究单词表上的单词:2个字母的单词、3个字母的单词、包含最高点值字母(j、q、x、a)的单词、短的单词、长的单词、包含许多元音的单词(miaou、zoeae),等等。选手们记住了变位词,也就是所有能由特定的字母组合组成的单词,然后在限定时间内不断练习拼字游戏。
拼字游戏比赛选手所具备的正字法专业知识与熟练的阅读者并不相同。后者是偶然学会了正字法统计知识,它就好比阅读过程中的一个副产品。而选手的专门知识则是通过特意练习而获得的,就像在10分钟之内吃下尽可能多的热狗这样的技能。阅读者需要知道单词的意思,而拼字游戏选手则不需要了解单词的意思。在参与比赛的过程中,了解字母a、p、t、y、k、l、i可以组成95个合理的单词是有帮助的。相反,阅读者必须识别出特定单词的模式,而不是在随意组成的字母串中发现某些单词。拼字游戏中的优秀选手是在不断的练习中获得了正字法的专业知识,而不是词汇量或者口头表达能力这类普通的技能。这些练习包括学习单词表、分析以前的比赛、花时间参加有竞争力的比赛等。拼字技能并不会被运用于阅读中,但是专业选手更善于辨别竖直呈现的单词,就像在比赛中一样。23
拼字游戏比赛选手具有的正字法专业知识就像伦敦出租车司机对城市街道详尽信息的了解一样。一项对出租车司机开展的著名研究表明,他们对这一详尽信息的学习能够促进部分海马中的灰质(主要是神经元)的增加,海马是一种对形成记忆至关重要的大脑结构。24我想在拼字游戏比赛中,人们同样能发现专业选手的大脑区域里具有相似的解剖学效应。这些大脑区域,有的可以将单词拼写进行编码,有的可以重组单词的拼写。
另一类正字法专家是拼写比赛中相互竞争的孩子们。他们也用了数千小时特意练习,记住单词的拼写。我目前没有找到任何关于正字法知识对孩子阅读或者学习成绩影响的研究。正字法知识的影响可能有点不可思议。在比赛中获胜使得孩子们对生僻的单词产生了兴趣,而从出现的频率来说,这些都是比较生僻的单词,例如stichomythia(轮流对白)和nunatak(冰原岛峰)。这类单词大都是科技术语或从其他语言引进的外来词,它们的确改变了参赛者正字法大数据的统计结果。与参加拼字游戏的选手不同,据报道,拼写冠军知道许多单词的意思,并且他们研究过词源学和单词的构成(形态学)。25他们阅读词典,而不是阅读包括字母j、k或q的由6个字母组成的一系列单词,这表明他们获得的知识具有很大的实用性。然而,这些选手也许会对美国高中毕业生学术能力水平考试(Scholastic Assessment Test,简称SAT)的新规则表示不满,因为在该规则下,掌握生僻单词的学生并不具备优势。
现在,一个显而易见的事实是,我们掌握的有关正字法结构的知识虽然不在拼字游戏比赛涉及的范围内,却足以让我们看懂那段关于剑桥恶作剧的文字。将单词里的字母重新排序明显是有影响的,因为修改后的文本比正常的文本更难读懂。然而,因为编码是冗余的,即使拼写有误,人们也可以识别出单词,只要这种错误的拼写不算太多。除了单词的第一个和最后一个字母保留在原有位置外,单词内部的字母也不能以任何随机的顺序排列,那段剑桥文字的作者一定是意识到了这一点,因为他在编写这段文字时,排除了一些会破坏预期效果的模式。他们主要使用了不规则性的最简单形式,颠倒两个字母的顺序,例如wrod(正确形式为word,意为“单词”)、oredr(正确形式为order,意为“顺序”)和letetr(正确形式为letter,意为“字母”)。这些改变叫作二元置换(bigram transposition)。更为精心设计的不规则拼写仅被用于少数单词,例如rscheearh(正确形式为research,意为“研究”,research一词一开始就被拼错了)。
人们很容易忽略二元置换。FCUK是英国服装品牌French Connection UK的标识,如果该服装品牌的名字是French Connection US,那么其标识就不易让人记住了。将单词the打成teh是一种常见的错误,以至于现在这一拼错的单词已经成为有自身含义和语法功能的术语。人们很容易识别二元置换,因为其字母顺序是不符合规则的(例如在单词词尾的cma和edr),或者其字母顺序是极为罕见的。它们很容易被纠正,因为与其他单词相比,这一胡乱写就的单词与正确的单词是比较接近的,例如oredr对应的正确的单词是order(顺序)。如果字母是随意打乱的,例如leretst,它与实际存在的单词的关联线索并不明确,将其恢复成正确的单词就有一定的难度。
有一个能输出类似那段剑桥文字的文本的程序证实,单词的更改只有限定在简单的范围内,例如二元置换,文本才具有可读性。26我们用那个程序复制粘贴一段文本,该文本的字母顺序就会被打乱,除了单词的第一个和最后一个字母得以保留。除非该文本是苏斯(Seuss)博士的儿童阅读绘本《绿鸡蛋和火腿》(Green Eggs and Ham)这种水平的,否则打乱后的版本几乎让人无法理解。下面是从维基百科上复制下来的一段文字:
①该句原为:In an old article that is undeservedly obscure, researcher Marilyn Adams pointed out that readability drops off rapidly if the vowel-less text includes less common words such as teachable, contusion, confabulate, and butterbeer.
我们对于字母顺序的真实敏感性是由两个相抗衡的因素塑造而成的。首先,字母的正确顺序是非常重要的,否则我们将难以区分tap(轻拍)、pat(拍打)和apt(恰当的),salt(盐)和slat(板条),也难以区分通过字母重组而形成的许多单词。其次,正字法的冗余造成了一定的回旋空间,使人们忽略了字母拼写的小错误。这种冗余包含字母组合方式的约束和大多数字母顺序并未构成单词的事实。大家普遍接受的一种解释就是,顺序信息的重要性是有差异的,人们也会根据这些差异做出相应的调整。27
对于阅读那段剑桥文字来说,正字法冗余是其主要依据,但并不是唯一的依据。读者的任务并不仅仅是识别出拼错的单词,而是即使有拼写错误的单词存在,仍然能够理解这段文字本身的含义。在这种情况下,这段文字并不是一团糟。理解这段文字的部分问题,已经通过保留几乎一半原封不动的单词而得到了解决,即66个单词中的32个未经过改动。人们也能利用已知的背景知识,如通过对大学名称和项目研究的了解来理解该段文字。
最后,我们能准确地理解那段著名的剑桥文字说明:当单词的第一个和最后一个字母处在正确的位置上,而单词内部的一些字母主要通过二元置换的方式被重组,这些单词存在于原本就有意义的上下文中,并且其中许多单词的拼写都是正确的,那么读者就能识别出这些单词。尽管该段文字的一些观点是错误的,但是正字法统计知识不仅仅对于拼写或拼字比赛至关重要,它对于熟练阅读也十分重要。那些拼字游戏专家有可能也很擅长阅读杂乱的文字。