虽然休谟想通过“换句话说”这个无伤大雅的插入语将这两个定义合二为一,但第二个定义明显不同于第一个。第二个定义明确地使用了反事实语言,因此它位于因果关系之梯的第三层级。比较而言,规律性是可以观察到的,而反事实只能凭想象生成。
休谟为什么选择从反事实而非其他的角度来定义原因,这一点值得我们思考。定义的目的是对一个复杂的概念进行简化。休谟猜测,相比于“前一个对象引起后一个对象”这一定义,他的读者能够更清晰地理解“假如没有前一个对象,那么后一个对象就不可能存在”这句话。他说的很对。前一句表述引发了种种徒劳的形而上学的猜想,即究竟是第一个事物的什么内在特质或能力引发了第二个事物。而后一种表述只是要求我们做一个简单的思维练习:想象一个没有发生地震的世界,判断在这个世界中海啸是否会发生。从孩童时代起,我们就一直在做这样的判断,人类这一族群至少从修昔底德那个年代(或者更久以前)就开始做这样的判断了。
然而,在19世纪和20世纪的大部分时间里,哲学家忽略了休谟的第二个定义。反事实表述——“假如”(would haves)在研究者眼中总是显得过于软弱和不确定。因此,如第一章所述,哲学家开始尝试使用概率因果论来补救休谟的第一个定义。
1973年,离经叛道的哲学家大卫·刘易斯在他的书《反事实》(Counterfactuals )中呼吁学界放弃规律性定义,而应该将“A导致B”解释为“假如没有A,则B就不会发生”。刘易斯问道:“为什么我们不从表面意义上看待反事实,将其看作对实际情况的其他可能性的一种表述呢?”
和休谟一样,刘易斯显然也折服于这一事实:人类能够轻而易举、快速便捷和始终如一地做出反事实判断。我们可以自信地赋予反事实陈述一个真值和概率,就像我们对事实陈述所做的那样。在刘易斯看来,我们是通过想象一个或多个“假如世界”来实现这一点的,在这些假如世界中,反事实陈述为真。
当我们说,“假如乔服用过阿司匹林,他的头痛本来应该好了”时,根据刘易斯的说法,我们就是在说在某个不同于现实世界的假如世界中,乔确实服用了阿司匹林,而他的头也的确不再痛了。刘易斯认为,我们是通过比较我们的世界(乔没有服用阿司匹林)和在其他方面与现实世界最相似的那个假如世界(乔服用了阿司匹林)来评估反事实陈述的。基于在那个世界里,乔不再头痛了,我们便声明这一反事实陈述是真的。其中,“最相似的那个”是关键。或许在其他一些“可能的世界”里,他的头痛没有消失,而是出现了一个临时的、偶然的情况,例如他服用了阿司匹林,但之后他撞到了浴室的门。而在乔服用阿司匹林的所有可能的世界中,与现实世界最为相似的不是他撞到头的那个,而是他的头痛消失的那个。
刘易斯认为可能的世界就相当于真实存在的世界,对此,诸多批评者纷纷抨击其言论过于大胆。“刘易斯先生的观点是,任何逻辑上可能的世界都可被认为是实际存在的。因此他曾被称为‘疯狗一般的模态实在论者’。”2001年,《纽约时报》在他的讣告中写道,“例如,他本人就相信,存在这样一个世界,其中驴会说人话。”
但我认为他的批评者(或许还包括刘易斯本人)都忽略了最重要的一点:我们根本不需要争论这样的世界是否以物理或者形而上学的实体形式存在。如果我们的目的是解释人们所说的“A导致B”的含义,那么我们只需要假设人们有能力在头脑中想象出可能的世界,并能判断出哪个世界“更接近”我们的真实世界即可;最重要的是我们的想象和判断要前后一致,这有助于我们在群体中达成共识。如果某人所认为的“更接近”的世界是另一个人认为的“更遥远”的世界,那么这两个人就肯定无法进行有效的反事实交流。从这一点上来看,刘易斯呼吁“为什么不从表面意义上看待反事实”并不是为了提出某种形而上学,而是为了引起人们对这一人类心理结构的惊人一致性的关注。
再一次,作为一名自封的辉格史学家,我可以很好地解释这种一致性:它源于这样一个事实,即我们体验的是同一个世界,并且共享因果结构的心理模型。在第一章我们一直在讨论这方面的内容。共同的心理模型将我们团结在一起。因此,我们对于可能世界与现实世界相近程度的判断,并没有借助于“相似性”的某个形而上学的观念,而是借助于这样一个标准,即我们必须在多大程度上对我们共享的心理模型进行拆解和打乱,才能使其满足一个与事实(乔没有服用阿司匹林)相反的给定的假设条件。
在结构因果模型中,我们所做的工作与此非常类似,只不过包含更多的数学细节。我们通过删除因果图中的箭头或结构模型中的方程来评估像“假如X曾是x”这样的表示,这与我们处理干预do(X=x)的方式是一样的。我们可以将这种方法描述为:对因果图进行尽可能小的修改,以满足X等于x。在这方面,结构模型中的反事实定义符合刘易斯“与现实世界最相似的那个可能世界”的观点。
结构因果模型还解决了刘易斯避而不谈的一个难题:如果可能性的数量远远超出人脑的处理能力,那么人类如何在头脑中表示“可能的世界”,并找到与现实世界最接近的那个?计算机科学家称此问题为“表示问题”(representation problem)。人类必然掌握着一种非常经济的代码才能管理如此多的可能世界。对此,结构因果模型是否能够以某种形态或形式来充当这一实用的便捷工具呢?我认为很有可能,原因有两个。第一,结构因果模型本身就是一个可行的捷径,在这个意义上它还没有找到任何竞争对手。第二,它是一种基于贝叶斯网络的模型,而贝叶斯网络又建立在大卫·鲁梅哈特对大脑传递信息方式的模拟之上。可以毫不夸张地说,4万年前,人类将其大脑中内置的模式识别机制进行了整合,并开始用整合后的机制进行因果推理,现代人类就由此产生了。
哲学家总是倾向于让心理学家来解释大脑是如何工作的,这也是上述问题直到最近才得到解决的原因。然而,人工智能领域的研究者没有耐心等待心理学家的结论。他们的目的是尽快制造出这样的机器人:它们能够与人交流各种不同的情景,乃至信誉和责备、责任和遗憾。对于这些反事实概念,研究者必须先将它们进行编码,实现处理过程的自动化,如此才有那么一丝机会实现所谓的“强人工智能”——类人智能。
在这些动机的驱使下,我和我的学生亚历克斯·巴克一起在1994年开始了反事实的研究。不出所料,在人工智能和认知科学领域,反事实的算法化所引起的震动比在哲学领域更大。哲学家倾向于把结构因果模型仅仅看作刘易斯的“可能的世界”逻辑的诸多实践方案之一。但我敢说,结构因果模型的内涵远不止于此。缺乏表示法的逻辑就是形而上学。而因果图,其包含简单的箭头跟踪和箭头删除方面的规则,肯定与人类大脑表示反事实的方式相似得多。
目前,这一论断尚未被证实,但我可以提前告诉你故事的结果——反事实不再神秘,我们了解了人类是如何处理它们的,也准备好了为机器人配备类似的功能,而这种能力我们的祖先在4万年前就已经进化出来了。