虽然一个器官也许在最初形成时还不是为了某个特定目的,但如果它现在服务于这个目的,我们就还是有理由说,它是专门为此设计的。按同样的原则,如果一个人为了某个特定目的去制造一台机器,但用的是旧轮子、旧弹簧、旧滑轮,只是经过细小的改动,那么,我们可以说,这整台机器,连同它的各个部分,是专门为这个目的而设计的。因此,在整个自然界中,每个生命体的几乎所有部分,在稍加修改的条件下,都很可能服务于不同的目的,并且在许多远古的和不同生命形式的活的机制中发挥作用。
——查尔斯·达尔文
(Charles Darwin, 1874)
巨大的大脑,就像巨大的政府,可能无法以简单的方式做简单的事。
——唐纳德·赫布
(Donald Hebb, 1958)
在人的发展过程中,最强大的驱动力来自他对自己的技术所产生的愉悦。他喜欢做他做得好的事,而且,如果已经可以做好,他就喜欢把它做得更好。
——雅各布·布罗诺夫斯基
(Jacob Bronowski, 1973)
我讲的思辨故事的一个特征是:我们的祖先像我们一样,从各种相对来说无人指导的自我探索模式中得到乐趣——他们一再地刺激自己,看看会发生什么。因为大脑是可塑的,再加上我们天生的不安分和好奇心会引导我们探索生存环境的每个角落(我们自己的身体是这一环境的一个重要且无处不在的要素),所以,回头来看,我们不会奇怪,我们居然偶然碰上一些自我刺激或自我调适的策略,由此形成一些习惯与倾向,后者又从根本上改变了我们大脑的内部交流结构;而且,这些发现成了文化的一部分,成了弥母,所有人都可以获得它们。
人类大脑由于弥母侵扰所引起的根本转变,是这个器官在能力方面的一次重大变动。正如我们所指出的,母语是汉语而非英语的人在大脑方面的差别,也许可以解释某些大脑能力方面的巨大差别,这些差别在行为中瞬间即可被识别,在许多实验背景下也很显著。例如,回忆一下,在以人类为被试的实验中,实验员(异现象学家)要知道被试是否已经理解实验指令,这是多么重要!这些功能差异虽然可能全都体现在大脑微观模式的改变上,但神经科学家却一样看不见它们,现在不行,很可能永远都不行。所以,如果要理解由这些弥母的侵扰所产生的功能架构,我们就必须找到一个更高的层次来描述它。很幸运,的确有一个这样的层次,一个来自计算机科学的层次。我们需要的描述与解释的层次,类似于(但并不等同于)计算机描述的其中一个“软件层次”:我们需要理解的是,人的意识如何可以由弥母在大脑里创造的虚拟机器的运作来实现。
这就是我将要捍卫的假说:
人的意识本身是巨大的弥母综合体(或更准确地说,是大脑里的弥母——效应的综合体),我们最好把它理解为一台“冯·诺依曼式的”虚拟机器的运作,这台机器被安装在大脑的并行架构中,而这个架构以前并不是为此类活动设计的。这台虚拟机器的力量,极大地增强了其运行所依靠的有机硬件的基础效能,但同时它的许多最为古怪的特征,特别是它的局限性,可以被解释成杂牌机(kludge)的副产品,后者使我们有可能奇怪而有效地再次利用一个现存器官,以服务于新的目的。
这个假说很快就会从我刚才陈述它的那些行话里浮现出来。我刚才为什么要使用行话?因为这些术语所涉及的富有价值的概念最近才被思考心智的人掌握。没有任何别的词可以干净利落地表达这些概念,但这些概念又非常值得我们去了解。所以,我会借助一段简短的历史题外话来引入这些概念,并将其放在我们将会使用它们的情境里。
计算机最重要的发明者当中的两位,是英国数学家图灵和匈牙利裔美国数学家、物理学家冯·诺依曼。虽然图灵也有足够的实践经验,亲自设计和建造过具有特定目标的电子解码机器,并帮助盟军在二战中取胜,但是,开启计算机时代的,却是他在发展通用图灵机的观念时所做的纯粹抽象的理论工作。冯·诺依曼则通过了解如何利用图灵的抽象理论(那真的很“哲学化”:它是一个思想实验,而不是一项工程提案),如何把它具体化,直到把它转化成一个(还是相当抽象的)设计,从而制造出一台实际可用的电子计算机。这个抽象的设计被称为冯·诺依曼架构(Von Neumann architecture),在今天世界上的每台计算机中几乎都能找到它,从巨大的“主机”到最普通的家用电脑核心部位的芯片都有这个设计。
计算机有一个基本的固定或硬连线架构,但也有巨大的可塑性,这主要得益于存储器的存在。存储器可以存储程序(或者叫作软件)和数据,后者是被用来追踪任何被表征物的暂时模式。与大脑一样,计算机一开始在设计上是不完整的,它有一定的灵活性,人们可以利用这种灵活性,把它作为创造具有专门约束的架构的媒介,这些架构就是具有特殊目标的机器,其中每个机器都用相当独特的方式去接受环境的刺激(通过键盘或其他输入设备),并最终产生反应[通过阴极射线管屏幕(CRT Screen)或其他输出设备]。
这些临时结构“由规则而非连线构成”,计算机科学家称它们为虚拟机器[17]。所谓虚拟机器,就是你为可塑性的对象加上一组特定的规则[更严格地说,是机器配置或变换规律(dispositions or transition regularities)]时你所得到的东西。考虑这种情况:有人胳膊断了,于是把胳膊包在石膏绷带里。这个绷带严重限制了他胳膊的移动,它的重量和形状也要求其他身体动作做出调整。现在考虑一个哑剧演员(比如马歇·马叟)在模仿一个胳膊打着石膏的人,如果这个哑剧演员演得很好,他的肢体运动就会以几乎完全一样的方式受到限制;他的胳膊上打着虚拟的石膏——“几乎是可见的”。任何熟悉文字处理软件的人都熟悉至少一种虚拟机器,而如果你用过几种不同的文字处理软件,或者在你使用文字处理软件的同一台电脑上使用Spread Sheet软件或玩游戏,你就会熟悉几种虚拟机器,它们在一台特定的真实计算机上轮流上阵。这些虚拟机器的差别非常明显,使用者在任何时间都知道他在与哪台虚拟机器打交道。
每个人都知道,不同的程序会赋予计算机不同的能力,但不是人人都知道细节。有些细节对我们的故事很重要,所以我请求你容忍我沉迷于这些细节,我会为图灵所发明的过程提供一个简要而基本的论述。
图灵在做出他那美妙的发明时,没有想过发明文字处理器或电子游戏。他在反思,作为一个数学家自己是如何着手解决数学问题或执行计算的,他走出的重要一步是,试着将他的心智行动的序列,拆分成它们的原始成分。想必他这样问过自己:“在执行一个计算时,我在做什么?哦,首先我问自己要用哪条规则,接着我应用这条规则,然后写下结果,随即我看着结果,问自己下一步做什么,之后……”图灵是一个条理超级清楚的思想家,但他的意识流,同你、我或是詹姆斯?乔伊斯[18]的一样,无疑是图像、决定、直觉、回忆等组成的杂乱无章的东西,他设法从中提取出数学的本质:只剩骨架的最小操作序列,这一序列能够完成他在自己有意识心智的鲜活而曲折的活动中所完成的目标。由此得到的结果,就能用于具体规定(specif ication)我们现在所说的图灵机,它是一种高度理性、高度理智的现象——一位数学家执行一次严格计算——天才式的理想化与简化。这个基本的观点有五个要素:
(1)一个串行过程(一次只发生一个事件);
(2)这个过程发生在一个严格限制的工作区;
(3)这个工作区汇集各种数据和指令;
(4)这些数据与指令来自一个不活跃但高度可靠的存储器;
(5)在这个存储器中数据与指令由一个有限集的原始操作来操作。
在图灵最初的表述中,工作区被设计成一个扫描器,它每次只看纸带上的一个方格上面写的是0还是1。根据它“看见”的情况,它要么擦掉0或1,打印出另一个符号,要么不动这个方格。然后它把这个纸带向左或向右移动一个方格再看,在每个动作中,它都受到一组有限集的硬连线指令支配,这个集合构成它的机器工作台。这个纸带就是存储器。
图灵的原始操作集(或者你可以说“从内省来看的原子式”行动)内容贫乏,这是刻意为之,这样它们从机械层面实现才不成问题。也就是说,对图灵的数学目标而言重要的是,毫无疑问,他所研究的过程中的每一步都要非常简单、非常愚笨,以至于连笨蛋都能执行,以至于这个人必须可以被一台机器取代。这些步骤包括浏览、擦除、打印、向左移动一格等。
他当然知道他的理想规定可以间接地作为一台真实计算机器的蓝图,而其他人就真的这样做了,尤其是冯·诺依曼,他修改了图灵的基本观念,创造了用于第一台实际可实现的数字计算机的抽象架构(见图7.4)。我们把这个架构叫作冯·诺依曼机器。
在图7.4中,左边是存储器或者说是随机存储器(RAM),这里保存着数据与指令,它们都以二进制的数字或者说“比特”来编码,如00011011或01001110。图灵的串行过程在由两个寄存器——累加器与指令寄存器——构成的工作区中进行。一条指令以电子方式复制到指令寄存器,后者随即执行这条指令。例如,如果指令说,“清空累加器”,计算机就会把0放进累加器;如果指令说,“将存储寄存器07的内容加到累加器的数字中”,计算机就会读取在存储寄存器中地址为07的任何数字(其内容可能是任何一个数字),把它加到累加器的数字里。如此等等。原始运算是哪些呢?基本上是算术运算,即加、减、乘、除;数据移动运算,即读取、存储、输出、输入;还有(计算机的“逻辑”心脏)条件指令,比如,“如果在累加器里的数字大于0,那么执行29号寄存器里的指令,否则就执行下一条指令”。视计算机的模型而定,有的也许只有少至16条指令的原始运算,有的则也许有几百条,所有运算都被连线在特定目标的电路结构中。每个原始运算都由一个唯一的二元模式编码(例如,加可能是1011,减可能是1101),只要这些特定的序列进入指令寄存器,它们就像拨出的电话号码一样,以机械的方式打开通向正确的特定目标回路的路线:加法电路或者减法电路等。两个寄存器在任何一个时间都只能显示一条指令或一个数值,这就是著名的“冯·诺依曼瓶颈”,系统的所有活动都不得不在这个瓶颈处排成一路纵队,通过一条狭窄的空隙。在一台快速计算机上,数以百万计的运算可以在一秒之内完成,它们数百万个串在一起完成的操作,在使用者看来就像魔法一样。
图7.4
所有数字计算机都是这种设计的直接后裔,虽然人们已经做出许多修正与改进,但是就像所有脊椎动物一样,这些计算机共享一个基本的底层架构(underlying architecture)。基本运算看起来像算术,似乎与正常意识流——想念巴黎,享受烤箱传出的面包香味,盘算着到哪里去休假——的这些基本“运算”没有多大关系,但图灵或冯·诺依曼并不担心这个。在他们看来,重要的是,这种行动序列可以“在原则上”得到细化,从而包括所有的“理性思想”,甚至也许还会包括所有“非理性的思想”。一个很大的历史讽刺是,从这种架构被创造出来的那一刻起,大众传媒就对它做了错误的描绘。这些激动人心的、新的冯·诺依曼机器被称为“巨大的电子脑”(giant electronic brains),但是,它们实际上是巨大的电子心智(giant electronic minds),是模仿威廉·詹姆斯所称的意识流的电子机制(只是经过了严重简化)。意识流是有意识的心智内容的曲折序列,詹姆斯·乔伊斯在其小说中做过著名的描写。与冯·诺依曼架构相反,大脑的架构主要是并行的,它有数以百万计的同时活动的运算通道。我们必须去理解的是,一个乔伊斯式的(或如我所说的“冯·诺依曼式的”)串行的现象,既然具有这么多我们熟悉的独特特征,如何能在大脑并行的喧闹世界中存在。
一个糟糕的想法是:我们的人类祖先需要以一种更加复杂、更有逻辑的方式来思考,所以自然选择逐渐设计并在人的大脑皮质的左(“逻辑的”“有意识的”)半球安装了硬连线的冯·诺依曼机器。我希望,从上文的演化故事中我们可以清楚地看到:虽然这也许在逻辑上是可能的,但它根本没有生物学上的合理性——我们的祖先也许能同样容易地长出翅膀或生下来就有手枪在手,然而事实上却没有。演化不是这样工作的。
我们知道,在大脑里有个东西,至少有点儿像冯·诺依曼机器,因为“通过反省”我们知道我们拥有有意识的“心智”,而我们由此发现的心智至少就在这一点上像冯·诺依曼机器:它们是冯·诺依曼机器的灵感来源!这一历史事实留下了一个特别引人注目的化石痕迹:计算机程序员会告诉你,给当前正在开发的并行计算机编写程序极其困难,而为串行的冯·诺依曼机器编程则相对容易。当你为一个传统的冯·诺依曼机器编写程序时,你随手就可得到帮助。当工作变得困难时,你会这样问自己:“如果我是机器,在解决这个问题时,我会怎么做?”这个问题指引你想出这种形式的回答:“哦,首先我做这个,然后我必须做那个,等等。”但如果你问自己:“如果我是上千个通道宽的并行处理器,那么在这种情况下我会做什么?”你会一无所获,你个人并不熟悉、也无法“直接访问”同时在上千个通道里发生的过程,即使那的确是你大脑里正在发生的事情。你对你大脑里发生的事情的唯一访问途径,也是以一种序列化的“格式”进行的,这就很像冯·诺依曼架构,虽然这样说是在颠倒历史。[19]
正如我们所看到的,在(标准的)计算机的串行架构与大脑的平行架构之间,存在很大的差别。常常有人引用这一事实来反对人工智能,人工智能力图通过编写(几乎总是)在冯·诺依曼机器上运行的程序,创造人类风格的智能。架构上的这种不同是否会造成理论方面的重要差别呢?从某种意义上来说,没有。图灵已经证明(这很可能是他最伟大的贡献):他的通用图灵机能够通过计算去实现任何架构的任何计算机通过计算所实现的任何功能。实际上,通用图灵机是最好的数学变色龙,有能力模仿任何其他的计算机器,在模仿期间,它可以精确地做出这些机器所做的事。你要做的全部工作就是,向通用图灵机输入关于另一台机器的合适描述,然后,就像装有舞蹈技能的马歇·马叟(通用哑剧表演机器)一样,它立刻产生一个基于这个描述的完美模仿——它以虚拟的形式变成另一台机器。因此,可以认为,一个计算机程序是一列要被遵守的原始指令,或是关于一台要被模仿的机器的描述。
你能模仿马歇·马叟模仿一个在模仿棒球击球手的醉汉吗?你也许发现,这里最难的部分是追踪模仿的不同层次,但对冯·诺依曼机器来说,这相当自然。一旦你有一台冯·诺依曼机器,可以在上面建造东西,那么你就可以像套盒那样嵌入虚拟机器。例如,你可以首先把你的冯·诺依曼机器转成一台Unix机器(Unix操作系统),然后在这台Unix机器上,实现Lisp机器(Lisp编程语言),还有WordStar、Lotus 123以及许许多多的其他虚拟机器,然后,在你的Lisp机器上再实现一个下棋的计算机。每台虚拟机器都可以通过它的用户界面来识别。用户界面是它显示在CRT(阴极射线管,用于电视屏幕、计算机显示器等设备)上的方式以及它对输入做出反应的方式。这种自我显示常被称为用户幻觉,因为用户无法说出也不关心自己正在使用的这台特定的虚拟机器是如何在硬件中被实现的。对用户来说,这台虚拟机器与硬件相隔一层、两层、三层还是十层,这并不重要。[20](例如,WordStar的用户一旦找到WordStar虚拟机器就能认出它,并与之互动,不管底层硬件方面有什么变化。)
虚拟机器是临时形成的一套高度结构化的规律,这些规律是通过一个程序加到基础硬件之上的,所以,虚拟机器是数十万个指令的结构化配方,这些指令给硬件提供了一个巨大的、相互连锁的习惯或反应配置(habits or dispositions-to-react)。如果你只看着所有这些指令的微观细节混乱地通过指令寄存器,你就会只见树木不见森林。但如果你往后退一点,你就能清楚地看见从所有这些微观场景中浮现出的功能架构。它的组成内容包括虚拟事物,比如:
文本字块、光标、擦除器、喷涂器、文件。
也包括虚拟位置,比如:
目录、菜单、屏幕、命令解释程序(shell)。
这些虚拟位置由虚拟路径连接,比如:
“退出到DOS”,或者从主菜单进入打印菜单。
并允许执行各种又大又有趣的虚拟运算,比如:
在文件里搜索一个词,或者放大画在屏幕上的盒子。
由于任何一台计算机都能被冯·诺依曼机器上的虚拟机器模仿,所以我们可以推断出,如果大脑是一台巨大的并行处理机器,那么它也能被一台冯·诺依曼机器完美地模仿。而且,从计算机时代开始以来,理论家们就利用冯·诺依曼机器的这种变色龙式的能力,创造虚拟的并行架构,人们认为这些架构是在给大脑式的结构建模。[21]你如何能够将在同一时刻只做一件事的机器,变成同时可以做很多件事的机器呢?通过一个类似于编织(knitting)的过程。
假设被模拟的并行处理器有10个通道宽(见图7.5)。首先,这台冯·诺依曼机器得到指令,执行第一个通道的第一个节点(节点1)所操作的运算,将结果保存在一个“缓冲”存储器里,然后是节点2,以此类推,直到第一层的10个节点都被推进一个时刻。然后,冯·诺依曼机器处理第一层每个结果对下一层节点的效果,从缓冲存储器中提取先前已经计算出的结果,把它们作为输入应用到第二层。它费力地这样做下去,来来回回地编织,以时间换空间。一台虚拟的10个通道宽的机器,至少需要10倍的时间,才能模仿一个通道宽的机器,而一台百万个通道宽的机器(如大脑),则至少要花100万倍的时间来模仿。图灵的证明没有提到这个模仿完成的速度,对某些架构而言,甚至运行速度骄人的现代数字计算机也会在这项任务面前不堪一击。这就是有兴趣探索并行架构力量的人工智能研究者,现在正转向真实的并行机器——把这种人造物称为“巨大的电子脑”也许是更合理的——并在这种机器上编写他们的模拟的原因。但在原则上,任何并行机器都能够完美地(可能效率不高)被模仿成一台基于串行的冯·诺依曼机器的虚拟机器。[22]
图7.5
现在我们准备把这个标准观念颠倒过来。就像你能在一台串行的冯·诺依曼机器里模仿一个并行的大脑那样,原则上,你在并行的硬件里也能模仿(某种像)冯·诺依曼机器(的东西),而这就是我现在要提出的:有意识的人类心智在一定程度上是串行的虚拟机器,这台机器是在演化已经提供给我们的并行硬件上(无效率地)实现的。
当我们谈论在大脑的并行硬件上运行的虚拟机器时,到底什么可以算作“程序”?重要的是,存在许多可调整的可塑性,可以接纳无数的微观习惯,因而也可以接纳不同的宏观习惯。在冯·诺依曼机器中,这是通过数以十万计的0与1(比特)实现的,它们被分成8、16、32或64比特的“字”,这视不同的机器而定。这些“字”分别存在存储器的寄存器里,每次只能访问指令寄存器中的一个“字”。在并行机中,我们可以猜想,它的实现要通过神经元之间数以千计、数以百万计甚至数以十亿计的联结强度环境,这些神经元一起合作,为基础硬件提供了一套新的宏观习惯、一套新的行为条件规律。
这些有着数以百万计的神经元联结强度的程序,是如何安装到大脑的计算机上的?在冯·诺依曼机器中,你只要把程序从磁盘“装”入主存储器就可以,由此计算机会瞬间得到一套新习惯;在大脑这里,这就需要训练,尤其包括本章第5节所描述的那种反复的自我刺激。这种类比当然不合适。冯·诺依曼机器的中央处理器以刻板的方式对待构成它文字的比特字符串,把它们看成在自己完全专有的、固定的机器语言中的指令。这些事实是存储程序的数字计算机的标志性特征,而人的大脑却不是这样。虽然很有可能,大脑神经元之间每个特定的联结强度的环境,都对由它所造成的周围网络的行为有着确定的影响,但是没有任何理由认为,两个不同的大脑会有相互联结的“相同系统”,所以几乎可以肯定,这里没有任何东西与固定机器语言相似,而所有比如IBM(国际商业机器公司)个人计算机与IBM兼容计算机都会共享这种机器语言。因此,如果两个或更多的大脑“共享软件”,它就不是通过一个简单而直接的过程,就像把一种机器语言程序从一个存储器拷贝到另一个存储器那样。[当然,可塑性以某种方式为大脑里的存储器提供子服务(subserve),我们不能孤立地把它看作一个被动的仓库;存储器与中央处理器之间的分工是人为设计的,大脑里没有与之类似的情况,我们会在第9章回到这一话题。]
既然有这样重要的也常被忽略的不当类比,我为什么还要坚持把人的意识比作软件呢?因为,正如我希望表明的那样,意识的一些重要的、原本极端令人困惑的特征,按照如下假说可以得到有启发性的解释:(1)人的意识是如此之新的一个革新,以至于它不能硬连线到天生机制中。(2)人的意识在很大程度上是文化演化的产物,在人的早期训练中变成大脑的一部分。(3)人的意识的成功“安装”取决于大脑可塑性的无数微观设备,而这意味着,它的重要功能特征在神经解剖学检查中很有可能是看不见的,虽然它的效果极端显著。没有哪个计算机科学家会通过从存储器的电压起伏图的不同信息出发、逐步向上建构的方法,来理解WordStar与WordPerfect各自的优劣;同样地,也没有一个认知科学家会期望只通过从神经解剖学向上建构就能明白人的意识。此外,(4)虚拟机器的用户幻觉这一观念的暗示意义令人可望而不可即。如果意识是一台虚拟机器,那么谁是产生用户幻觉的用户?我承认,这看上去很可疑,好像我们正不可阻挡地漂回到一个内在的笛卡儿式自我,它坐在大脑皮质工作站,对在那里运行的软件的用户幻觉做出反应,但我们将会看到,还是有一些方法可以帮助我们逃离这个可怕的结局。
现在暂时假设,在弥母圈中有一个乔伊斯机器,它是意识流虚拟机器的一个设计比较良好的(排除错误的)版本。如我们所见,由于大脑之间没有共享的机器语言,因此传播弥母的方法,若要能保证一台相当一致的虚拟机器在文化中运行,它们就必定是社会性的、高度受情境影响的,而且有一定程度的自组织和自纠正能力。使两台不同的计算机(比如一台苹果电脑和一台IBM个人电脑)能“相互交谈”,这是一个复杂而棘手的工程问题,必须依赖关于两个系统内部机制的精确信息。人类能够在没人掌握上述知识的情况下“共享软件”,这必定是因为,这些被共享的系统有着高度的可靠性和格式容错度。有若干方法可以共享这种软件:通过模仿来学习,由“强化”所导致的学习(要么由老师通过奖励、鼓励、责备、威胁等方式有意强加,要么在谈话中巧妙而无意识地传播),以及在通过前两个办法学会自然语言后,再用自然语言中的明确指令来学习。(例如,想一想频繁地对一个新手说“告诉我你在做什么”和“告诉我为什么你要这样做”会诱发什么样的习惯。再想一想新手养成习惯向自己提出同样的问题会是什么样子。)
我推测,除了口语,书面语言在发展和细化我们大多数人的大脑里大部分时间运行的虚拟机器方面,也发挥着重要作用。就像轮子只是技术的很小一部分,它还相当依赖铁路、平整的道路或为使用它而制作的其他人造平面来发挥效用,我现在所说的虚拟机器也只能在这样的环境中存在——这里不只有语言和社会互动,还有文字与图表,而这只是因为,实现这个机器需要存储与模式识别,这些又要求大脑把它的一些记忆内容“卸载”到环境里的各种缓冲器中。(请注意,这意味着,“有文字以前的心智状态”完全可以包含一组虚拟架构,与我们在文字社会里见到的很不一样。)
想想吧,在你头脑里把两个十位数相加,不用纸和铅笔,也不要大声说出这些数字。想想吧,试着在不用图表的情况下,找出一种办法,把三条高速公路连入苜蓿叶式风格的立交桥的交叉位置,使人可以从其中任何一条高速公路的任意方向上,行驶到任意一条别的高速公路的任意方向上,而且不必经过第三条高速公路。这些都是人类很容易解决的问题,但这需要外部记忆装置的帮助,也需要运用他们预先存在的扫描器(眼睛和耳朵),这些扫描器有着高度发达的硬连线的模式识别回路。(对此话题的一些有价值评论,参见Rumelhart, ch.14 ,载于McClelland and Rumelhart, 1986。)
在儿童发展的早期阶段,我们在大脑中安装了一套有组织的、部分经过预先测试的心智习惯(habits of mind)。心智习惯是政治学者霍华德·马戈利斯(Howard Margolis, 1987)提出的说法。在第9章中我们会更仔细地观察这个架构可能有的细节,但在此我要提出,这套新的规律的总体结构是串行链接,先是一件“事情”发生,然后是另一件“事情”在(大致)同一个“位置”发生。这个事件流由许多习得的习惯引发,自言自语是其中的一个主要例子。
由于在我们内部创造出来的这台新机器是一个高度复制的弥母综合体(highly replicated meme-complex),因而我们可以问,它能够成功复制应归功于什么。当然我们应该记住,也许它并不是对任何事情而言都是好的——除复制以外。它也许是一个软件病毒,很容易寄生在人的大脑里,但实际上却不给它侵扰的大脑任何竞争优势。更有可能的是,这台机器的某些特征也许是寄生虫,它们的存在只是因为它们能够存在,因为不可能或不值得花工夫去清除它们。威廉·詹姆斯认为,这种假设很荒唐:我们所知的这个宇宙中最为令人惊异的事物,即意识,只是一种在我们大脑的运作机制方面不发挥任何本质作用的东西。但是,无论这种情况多么不可能,我们也不能完全排除这种可能性,因而它也不是真的很荒唐。我们有大量的证据证明,意识在表面上可以给我们带来益处,所以我们无疑能够弄清楚它的各种存在理由(raisons d’être),但是,我们很可能会误读那些证据,我们可能会认为,除非每个单独的特征都有或曾经有一个功能(从我们作为意识“用户”的视点来看),否则意识就仍然存在神秘之处(Harnad, 1982)。一些原生的事实虽然缺乏功能依据,但也有存在的空间。意识的一些特征也许就只是自私的弥母。
不过,从光明的一面来看,这台貌似经过良好设计的新机器是为了解决什么问题而打造的?心理学家朱利安·杰恩斯(Julian Jaynes, 1976)很有说服力地指出,它的自我规劝和自我提醒的能力,构成复杂而长期的自我控制的先决条件,没有这种能力,农业、建筑计划以及其他已经文明化和正在文明化的活动就不能被组织起来。它似乎也有助于自我监控,保护一个有缺陷的系统免受自身缺点的危害,而这是道格拉斯·霍夫施塔特[23](Douglas Hofstadter, 1985)在人工智能中所发展的一个主题。在心理学家尼古拉斯·汉弗莱(Nicholas Humphrey, 1976, 1983a, 1986)看来,这就提供了一种利用社会模仿(social simulation)的手段,而所谓社会模仿,是指运用内省来引导人们对别人正在思考和感觉的东西的直觉。[24]
解决“接着思考什么”这一后设问题的基本能力,支撑着这些更高级、更专业的才能。我们在本章前面已经看到,在一个有机体遇到危机时(或只是遇到一个困难的新问题时),它也许有一些资源,而这些资源在这些环境中要有价值,就必须能及时发现它们并将其投入使用!按奥德玛·诺伊曼的推测,定向反应就有一种富于价值的效果,可以一次性地、在一定程度上发动每个人,但正如我们所见,完成这种全局觉醒是解决方案的一部分,也是问题的一部分。它也许根本不能起作用,除非在下一步大脑设法依靠这些志愿者完成某种连贯的活动。定向反应部分地解决了这个问题:从一组过去只会关心自己事情的特化回路中取得总体的、全局的访问权。由于有群魔混战风格的底层架构,因此混乱很快就能平息,留下一个特化回路暂时负责(它或许也更了解它所赢得的竞争),但即便如此,也明显会有一些坏的方式来解决这些冲突,其数量至少与好的方式一样多。没有任何东西可以保证在政治上最有效力的特化回路会成为“最合适的工作者”。
2000多年以前,柏拉图就清楚地看出问题所在,他想出一个绝妙的比喻来描述它:
现在思考一下,知识是不是这样一种东西:你可以拥有它,但它却不在你身上,就像有人捉住一些野鸟——比如鸽子或其他什么——然后把它们养在家中专门为它们做的鸟舍里。当然,在某种意义上,我们也许可以说,这个人一直“拥有”这些野鸟,只要他占有它们,为什么我们不可以这样说呢?……而在另一个意义上,虽然他控制着它们,因为他已经把它们捉到他自己的鸟舍里,但他却并未“拥有”它们。他能捉住它们,只要他愿意,他就可以捉住他选择的任何一只,并让它们再次飞走。他想这样做多少次,就可以做多少次……所以现在让我们假设,每个心智都包含一个鸟舍,里面囚着各种各样的鸟,有的聚集成群,与其余的鸟分开,有的形成一个小群体,有的则孤零零的,它们朝着各个方向飞去……[《泰阿泰德》(Theaetetus, 197-198a),英文取自康福德(Cornford)译本]
柏拉图看到的是,只捉住鸟还不够,困难的部分是,学会如何让你所呼唤的鸟飞到你面前。他进而主张,通过推理,我们提升了在正确时间得到正确的鸟的能力。其实,学会推理就是学会提取知识的策略。[25]这便是心智习惯入场的地方。我们已经粗略地看到,一些普遍的心智习惯,比如自言自语或自画图表,可以碰巧梳理出少量的正确信息,使其到达表层(什么的表层?——这个话题我会推迟到第10章再谈)。但是,更为特定的心智习惯,也就是经过精炼和细化的自言自语的特定方式,可以进一步增加你成功的机会。
哲学家吉尔伯特·赖尔在他的遗作《论思考》(On Thinking , 1979)中提出:思考,即罗丹的著名雕塑“思想者”(Thinker)所进行的那种缓慢、困难、苦苦的思索,其实必定是一种自言自语的事情。惊讶,太惊讶了!那是我们在思考时才做的事,这难道不是很明显吗?哦,是,又不是。明显的是,那是我们(常常)似乎在做的;我们甚至可以经常告诉彼此,我们在自己无声的独白中所表达的各种话语。不明显的则是,为什么自言自语会有任何好处。
思想者(Le Penseur)在他的笛卡儿式内部像是在做什么?或者,这样说听起来会科学一点儿:在那个笛卡儿式的暗箱(camera obscura)里进行的心理过程是怎样的?……众所周知,我们的一些思索以解决我们的问题告终,但并非全部思索都是如此。我们曾经陷入迷雾,但最终我们拨得云开见日出。但是,如果有时可以成功,为什么不能总是成功?如果姗姗来迟,为什么不是迅速就来?如果有困难,为什么不是很容易?为什么它曾经起作用?它又如何可能起作用?(Ryle, 1979, p. 65)
心智习惯长期以来被设计得沿着人们熟悉的探索之路塑造种种通道。正如马戈利斯所指出的那样:
人类甚至在今天都不能(所以回头来看当代人类的远古祖先也就更加不能)轻易地或稀松平常地在几十秒里注意一个问题而毫不间断。但我们还是在解决那些需要更多时间来解决的问
题。我们的解决方法(可以通过观察自己来发现)是反复思考后进行概述,向自己描述在反复思考时似乎得出的东西,引出我们所达到的任意中间结果。这样做有一种明显的功能:通过复述这些中间结果……我们使之成为记忆的一部分,因为意识流的这些中间内容一旦不能被重述就会很快丢失……有了语言,我们就可以向自己描述,在导致一个判断产生的反复思考阶段里似乎发生了什么,然后产生一个可复述的版本,说明形成一个判断的过程,最后通过实际的复述使这个结果成为长期记忆的一部分。(Margolis, 1987, p. 60)
我们应该在这里,在自我刺激的个体习惯中,寻找杂牌机(它与帮手押韵,正好是一对儿);杂牌机是电脑黑客的术语,指的是一些特设性的应急装置,在除错调试的过程中它们通常被做成软件的补丁,使机器可以运作。[26]语言学家芭芭拉·帕蒂(Barbara Partee)曾经批评,在人工智能的语言分析程序中加入笨拙的补丁,这是一个“古怪的黑客程序”——就像我曾遇到的那种偶然发现的斯本内现象一样。[27]大自然充满古怪的黑客程序,而我们在个体对虚拟机器的个人化选用过程中应该也可以找到这些程序。
这里有一个看起来合理的例子:由于人的记忆并非天生被设计用来成为超级可靠的、快速访问的、随机访问的存储器(而这是每台冯·诺依曼机器所需要的),因此,当冯·诺依曼式虚拟机器的(按文化和时间分布的)设计者面临一个任务,即要拼凑出一台能在大脑中运行的合适替代品时,他们偶然发现了各种增强记忆的计策。基本的计策是复述、复述、再复述,并借助押韵和富于节奏的、容易记忆的格言。(押韵与节奏利用预先存在的听觉分析系统的巨大力量来识别声音中的模式。)刻意地、反复地把我们需要在它们之间建立联结的元素放在一起,这样,其中的一个项目就总是会“提醒”大脑想起下一个项目。我们可以设想,这种活动还能这样进一步增强,即形成尽可能丰富的联结,不仅使之具有视觉和听觉的特征,而且利用整个身体去做。思想者皱眉、托起下巴、挠头、嘀咕和踱步,以及我们因人而异的写写画画,这些动作不仅可以是有意识思考的随机副产品,而且还能是功能贡献因子(或者是早期更粗糙的功能贡献因子发育不全的遗迹),它们帮助大脑进行辛苦的训练,要变成一个成熟的心智就必须完成这种训练。
为了取代精确的、系统的“读取——执行周期”或“指令周期”(它们把每个新的指令带到指令寄存器中去执行),我们应该去寻找那些没有经过好好整理、游来荡去、绝不合乎逻辑的转换“规则”,在这里,大脑天生的“自由联想”倾向,得到长而又长的联想链条的配合,从而多少可以确保大脑试出正确的序列。(在第9章我们将考虑这一观念在人工智能中的细化情况。关于重点不同的细化情况,可参见Margolis, 1987; Calvin, 1987, 1989; Dennett, 1991b。)我们不应该期望大多数发生的序列是得到充分证明的算法,可以确保产生我们所寻求的结果,而只应该期望,突袭柏拉图鸟舍的结果,只比完全碰运气好一点儿。
与计算机科学的虚拟机器的类比,给人类意识现象提供了一个有用的视角。计算机原来只被视作数字计算器,但现在,利用它们的数字计算的方法有上千种,而且很有想象力,人们用这种数字计算来创造新的虚拟机器,比如电子游戏和文字处理软件,在这里,底层的数字计算几乎是不可见的,而新生的力量似乎相当神奇。同样,我们的大脑也不是为文字处理而设计的(除了某些相对近期的外围器官),但现在,在成人大脑里进行的很大一部分(或许是最大一部分)活动会牵涉到文字处理:言语生产与理解,以及语言项目或(更好地说)其神经替身的串行彩排与重组。这些活动(从“外部”来看)以似乎相当神奇的方式,放大和改变了底层硬件的力量。
然而,人们依然可以说(我敢肯定你想反对):所有这些都与意识没有多少关系或者完全没有关系!毕竟,一台冯·诺依曼机器是完全无意识的;为什么实现了这个机器,或者实现了与之类似的东西即乔伊斯机器,就会多出一个意识来呢?我还真有一个答案:由于冯·诺依曼机器一开始就以那种方式连线,信息联结的效率又最高,因此它不必成为它自己的精细知觉系统的对象。[28]此外,乔伊斯机器的工作,就如同它被设计去感知的外在世界的任何事物一样,是它“可以看到的”“可以听到的”——理由很简单,许多相同的知觉机制就聚焦在这些工作上面。
我知道,这看起来就像一个照镜子的把戏(a trick with mirrors)。它确实是反直觉的、难以下咽的,最初简直让人无法容忍——一个观念若是能够突破几个世纪以来的谜团、争议与混淆,你也就可以预期会看到这样的情况。在接下来的两章里,我们会更仔细地、以怀疑的精神去考察,用什么方式可以表明,这个表面的照镜子把戏可以成为意识解释的一个合理部分。
[1]你可以推断,我在自己的故事中所运用的一切东西我都认为是正确的——或者是在正确的轨道上,但你千万不要从我省略某个理论或某个理论中的细节这一事实出发,就得出结论说,我认为它是错的。同时你也不能因为我使用了某个理论的少数细节,就推断出我认为这个理论的其余部分也是可辩护的。这也适用于我早期讨论这一主题的著作,其中一些文字我将直接在此引用。
[2]约翰·梅纳德·史密斯(John Maynard Smith)是这方面的一位领先的理论家,除了他的经典著作《性的演化》(The Evolution of Sex, 1978)外,他的论文集《性、博弈与演化》(Sex, Games, and Evolution, 1989)中也有许多讨论概念难题的精彩文章。(对这些论题的简要综述,可参见R. Dawkins, 1976, pp. 46-48。)
[3]多功能神经元这个想法并不新颖,但直到最近才有人追随:神经元输出或信号多多少少是同时联结的,这是毫不含糊的,个体神经元的输出则不是。每个相继层次模糊信号的不同联结,汇集起来就可以部分地解决模糊问题,就像在纵横字谜里,模糊的界定汇集起来就确定了唯一或接近唯一的解决方案。(Dennett, 1969, p. 56)……并不存在独一无二的群结构或群组合,对应一个特定的输出种类或输出模式,相反,不止一种神经元群的组合能够产生一个具体的输出,一个特定的单一群也能参与不止一种类型的信传(signaling)功能。神经元群在指令集里的这种特性,叫作简并(degeneracy),这一特性为可再入图(reentrant maps)的一般化能力提供了根本的基础。(Edelman, 1989, p. 50)每个节点都影响到许多不同的内容这一建构特征,赫布(Hebb)在他开拓性的著作《行为的组织:一个神经心理学理论》(The Organization of Behavior: A Neuropsy-chological Theory, 1949)中已经做过强调。这是“并行分布处理”或“联结主义”的核心。但是,多重功能当然也不止这一点;在一个比较粗糙的分析层次上,我们会让整个系统拥有特化的角色,但这些系统也可以被征用到更一般的计划之中。
[4]海鞘与副教授之间的类比,我想是由神经科学家鲁道夫·利纳斯(Rodolfo Llinás)首先提出的。
[5]这一点很像沙克把盒子与棱锥分开的方法,不可能完全不出问题。因此,机器人沙克并不完全是非生物的;生物圈有许多像这样的小工具。但沙克的“视觉”系统不是任何物种的视觉的一个好模型,不过这并非它的重点所在。
[6]这一基本洞见可见于达尔文及其早期诠释者的著作中(Richards, 1987)。神经解剖学家J.Z. 扬(Young, 1965a, 1965b)率先提出记忆的选择主义理论(也可参见Young, 1979)。1965年,我在牛津大学的博士论文中发展了这个基本论点的一个哲学家版本,并对细节进行了简略描述;它的改进版是1969年《内容与意识》(Content and Consciousness )的第三章“大脑里的演化”(Evolution in the Brain)。约翰·霍兰(John Holland, 1975)和其他人工智能的研究者开发出关于自我重新设计或学习系统的“遗传算法”(又见Holland, Holyoak, Nisbett and Thagard, 1986),让——皮埃尔·尚热(Changeux and Danchin, 1976; Changeux and Dehaene, 1989)设计了一个相当详细的神经模型。神经生物学家威廉·卡尔文(William Calvin,1987, 1989a)在他自己关于大脑里的演化的理论中,对这些论题提出一个不同的(也更易理解的)视角。关于这一点,可参见他对杰拉尔德·埃德尔曼(Gerald Edelman)的《神经达尔文主义》(Neural Darwinism , 1987)清晰而富洞察力的综述(Calvin, 1989b)。更近一点,埃德尔曼出版了著作《被记忆的当下:意识的生物学理论》(The Remembered Present: A Biological Theory of Consciousness, 1989)。(The Remembered Present书名模仿的是《追忆逝水年华》的英文版书名The Remembered Past。——译者注)
[7]干草堆里摸针,意思近于中文里所谓的“大海捞针”。——译者注
[8]此处mate是作者所说的四个F之一,其实意思指向fuck,但作者用了“mate”这个文明一点的单词。——编者注
[9]这是心智哲学中关于心智内容或意向性(mental content or intentionality)的基本问题,而人们对此提出的种种解决方案都充满争议。我的解决方案是在《意向立场》(The Intentional Stance, 1987a)中给出的。
[10]少数无畏的理论家主张别的观点。例如,杰里·福多尔(Jerry Fodor, 1975)主张,人所具有的一切概念都是被先天赋予的,只是被特定的“学习”经验所触发或者访问罢了。所以亚里士多德的大脑里也有飞机的概念,也有自行车的概念,他只是没有机会使用它们!针对那些嘲笑这一荒唐观点的人,福多尔会回答说,免疫学者过去常常嘲笑一种观点,这种观点认为,人——比如亚里士多德——一生下来就有数以百万计的不同抗体,包括那些专门针对20世纪才在自然界中出现的化合物的抗体,但如今这些人再不笑了,因为这个观点后来被证明是对的。这种观点在应用于免疫学与心理学时会遇到的麻烦是,它的激进版明显是错的,而它的温和版则与被反对的那个观点无法区别。在免疫系统里存在组合反应——不是所有的免疫反应都是一对一的、介于先行存在的抗体的单个类型之间。类似地,也许亚里士多德有一个先天的飞机概念,但他也有一个机身宽大的大型喷气式客机的先天概念吗?还有波士顿——伦敦往返的优惠预订机票的概念呢?在这些问题弄清楚之前,在这两个领域中,都会有某些类似于学习的东西,以及某些像是天赋观念的东西。
[11]当然我是在暗指保罗·格赖斯(Paul Grice)的非自然意义理论(Grice, 1957, 1969),但有一个新的交流理论取代了格赖斯理论的某些脆弱和不大可能的特征(参见Sperber and Wilson, 1986)。
[12]我有什么权利来谈论这些意识尚未完全发展的祖先的信念与需要?在《意向立场》中,我阐述了我关于信念与欲望的理论,这个理论所捍卫的观点是,没有好的理由把这些项目放到强调引号之内:“低级”动物(甚至如青蛙)的行为,就像人的行为一样,适合作为意向立场解释的一个领域,可以认为这种行为有信念与欲望。但是,不同意这个理论的读者可以认为,这里的术语是在一种扩展的隐喻意义上来使用的。
[13]关于灵长类动物的交流,以及猿与猴是否有能力进行有意欺骗这一尚未解决的经验性问题,可参阅相关文献(如Dennett, 1983, 1988c, 1988d, 1989a; Byrne and Whiten, 1988; Whiten and Byrne, 1988)。
[14]在小说《小径分岔的花园》中,博尔赫斯(Borges, 1962)设计出了这个策略的一个极为聪明的版本,但我在这里不会描述它,以免泄露故事的结局。
[15]这一节取自我的《弥母和对想象力的利用》(“Memes and the Exploitation of Imagina-tion”, 1990a)。[meme一词读音为[mi:m],又译谜米、觅母、拟子、弥因、模因、摹因等。本书统一译为“弥母”。Memetics译为“弥母学”。弥,取弥漫传播之义;母,与基因之因相似,取因袭传衍之义。Meme一词最初为道金斯(Dawkins, 1976)对照gene(基因)所创,是文化演化的基本单位,参见下文内容。——译者注]
[16]参见相关文献(Pinker and Bloom, 1990)以及随后的评论,学者们对近期语言演化的思辨文献中的争议,做了很好的互动讨论。
[17]纯粹主义者可能会反驳,我对虚拟机器这个术语的使用在某种程度上比他们在计算机科学中所推荐的用法要更广泛。我的回答是,就像大自然一样,当我看到一个随手可得的东西可以“外适应”(exapt)并做出一种扩展的应用(Gould, 1980)时,我就会尝试用这个术语。
[18]詹姆斯·乔伊斯,爱尔兰作家,意识流小说《尤利西斯》的作者。——译者注
[19]大脑首先在自然中演化出来,然后才有人发明电脑架构。——译者注
[20]也许它根本不是一台虚拟机器。它可能是一台定做的、硬连线的、具有特定目的的真实机器,如一台Lisp机器,它是Lisp虚拟机器的后裔,它的设计允许我们直接在它的硅晶片上运行Lisp编程语言。
[21]“逻辑神经元”(McCulloch and Pitts, 1943)的设计实际上与串行计算机的发明是同时出现的,它影响了冯·诺依曼的思考,而这些又引出20世纪50年代出现的知觉器,后者是今天联结主义的祖先。(简要的历史描述可参见Papert, 1988。)
[22]关于真实世界速度的含义以及它对人工智能的含义的更多内容,参见我的《意向立场》中的“快速思考”(Fast Thinking)。
[23]道格拉斯·霍夫施塔特的另一个通行译名是“侯世达”。——译者注
[24]大概从1996年以来,以里佐拉蒂(Rizzolatti)为代表的认知神经科学家发现了猴子和人类的大脑中存在镜像神经元(mirror neuron),拉马钱德兰(Ramachandran)认为此项研究之于心理学,其意义可与生物学领域发现DNA双螺旋结构相比。如今,以此为基础的模仿理论已经成为研究人类心理特别是同感以至道德感的标准方法,同时也使以科学的而不是单纯概念分析的方法来研究甚至解决他心、读心问题成为可能。参见Rizzolatti, G., Fadiga, L., Gallese, V. and Fogassi, L. (1996) Premotor cortex and the recognition of motor actions. Cog. Brain Res., 3:131-141。——译者注
[25]对人工智能思想的推理与检索这两派之间的(明显)分歧的有趣讨论,参见Simon and Kaplan, 1989, pp. 18-19。
[26]杂牌机,kludge;帮手,stooge。作者提示这种押韵也许是想表明,寻找杂牌机在某种意义上就是寻找帮手。——译者注
[27]斯本内现象,spoonerism,又叫首音误置现象,将两个或两个以上的词的首字母互移。如W.A. 斯本内说出You have tasted two worms,但他本来应说You have wasted two terms。——译者注
[28]因此就不必有意识。不能以为因为人类有意识,所以机器也要有意识才高级。机器的设计基础也许比人类意识所得以可能的设计基础好得多,以至于没有意识也至少一样厉害。——译者注