原则上,反事实在法庭上的应用应该很简单。我说“原则上”是因为法律界很保守,通常需要很长时间才能接受新的数学方法。但是在法律界,将反事实作为论据的做法实际上历史悠久,其被称为“若非因果关系”。
《模范刑法典》 [8] 是这样解释“若非”测试的:“行为是导致结果的原因,其前提是:(a)行为是一个先行项,若非它,结果就不会发生。”假如被告开了一枪,击中并杀死了受害者,则开枪射击就是受害者死亡的“若非因”或必要因,因为假如被告没有开枪,受害者就不会死。“若非因”也可以是间接的。假设乔用家具挡住了大楼的消防通道,而朱蒂在发现无法从出口出去之后死在了大火中,那么即使乔不是点火的人,他对她的死也负有法律责任。
我们应该怎样用潜在结果表达必要因或“若非因”?如果我们用结果Y表示“朱蒂的死亡”(假如朱蒂活着,Y=0;假如朱迪死了,Y=1),行为X表示“乔堵住消防通道”(假如他没堵住,X=0;假如他堵住了,X=1)。我们要问的是以下这个问题:
已知乔堵住消防通道(X=1),并且朱蒂死了(Y=1),假如X为0,那么朱蒂还活着(Y=0)的概率是多少?
我们想要评估的概率可以用符号表示为P(YX =0 =0|X=1,Y=1)。这个表达式相当烦琐,我在接下来会将它缩写为“PN”(probability of necessity),即必要性概率(在此例中表示X=1为Y=1的必要因或“若非因”的概率)。
请注意,必要性概率涉及两个不同的世界之间的对比:X=1的现实世界和X=0(用下标X=0表示)的反事实世界。事实上,是否有事后判断(知道现实世界中发生了什么事情)是反事实(因果关系之梯的第三层级)和干预(第二层级)之间的关键区别。没有事后判断,P(YX =0 =0)和P(Y=0|do(X=0))之间就没有区别,都表示在正常情况下,如果我们确保消防通道没被堵住,朱蒂就不会死;两个方程都不涉及火灾、朱蒂的死亡或被堵住的消防通道。但事后判断可能会改变我们对概率的估计。假设我们观察到消防通道被堵住X=1以及朱迪死于火灾Y=1(事后判断),那么P(YX =0 =0|X=1,Y=1)与P(YX =0 =0|X=1)就是不一样的。知道朱蒂死了(Y=1)为我们提供的环境信息,是仅靠知道通道被堵住(X=1)所得不到的。比如,它首先就证明了火灾的强度。
事实证明,do表达式无法捕捉P(YX =0 =0|X=1,Y=1)。虽然具体的论证过程可能有些晦涩难懂,但这一结论的确提供了一个数学上的证明,即在因果关系之梯中,反事实(第三层级)要高于干预(第二层级)。
在上面的几段文字中,我们几乎是悄无声息地将概率引入了讨论。律师们早就明白,“确定无疑”(mathematical certainty)是一种过高的证据标准。美国最高法院于1880年规定,刑事案件的定罪必须“排除所有合理的质疑”。注意,最高法院说的不是“排除所有的质疑”,而是“排除所有合理的质疑”,而法院从来没有给出过“合理”这个词的确切定义。有些人猜测可能存在某个阈值,比如99%或99.9%的概率有罪,超过这个阈值,质疑就变得不合理了,因而为了社会的利益,被告就必须被判刑。在民事而非刑事诉讼中,举证标准相对更清晰一些。民事法要求根据“优势证据标准”(preponderance of evidence)证明被告的确造成了伤害,我们可以合理猜测其内含的阈值很可能大于50%。
虽然“若非因果关系”已被普遍接受,但律师们已经发现,在某些情况下它可能会导致司法不公。一个典型的例子是“坠落的钢琴”,其中被告向受害者开了一枪,但没有击中。在受害者逃离现场的过程中,他碰巧被一架坠落的钢琴砸死了。使用“若非”测试,被告会被判犯有谋杀罪,因为假如受害者没有因被告开枪而逃跑,他就不会跑到坠落的钢琴附近,因而也就不会死亡。但直觉告诉我们,被告并没有犯谋杀罪(当然他很可能犯了谋杀未遂罪),因为他不可能预料到钢琴的坠落。辩护律师可能会说,钢琴,而不是枪击,才是受害者死亡的近因。
近因原则远比“若非因”原则更晦涩。《模范刑法典》规定,结果不应该“离事件太遥远或是事件的次要方面,以致与行为人的责任或罪行的严重性关系很小”。就目前而言,这种判定被留给了法官的直觉。我认为近因是充分因的一种形式,即被告的行为是否足以(有足够高的概率)导致死亡事件。
虽然近因的含义非常模糊,但充分因的含义则相当精确。使用反事实符号,我们可以定义充分性概率或PS(probability of sufficiency)为P(YX =1 =1|X=0,Y=0)。这一定义有助于我们想象这样一种情况,X=0且Y=0,即被告没有向受害者开枪,且受害者没有跑到钢琴下。然后我们要问的是,在这种情况下,被告射击(X=1)导致结果受害者跑到钢琴下(Y=1)的可能性有多大?这要求我们进行反事实的判断,但我认为大多数人都同意,这种结果出现的可能性非常小。直觉和《模范刑法典》都表明,如果PS太小,我们就不应该判被告犯谋杀罪,导致了Y=1。
由于必要因和充分因之间的区别是如此重要,我认为以简单的例子来说明这两个概念或许能帮助我们更好地理解它们。充分因在两者中更加常见,在第一章的行刑队执行枪决的例子中,我们已经遇到了这个概念。在那个例子里,士兵A或士兵B无论哪个开枪都足以造成囚犯死亡,而且两个士兵(自身的行为)都不是必要因。所以对于这个例子,PS=1且PN=0。
当出现不确定因素时,事情就会变得有趣起来,例如,我们可以假定每个士兵都有可能不服从命令或射失目标。如果士兵A射失目标的概率是pA ,那么他的PS将是1–pA ,这是他击中目标并造成犯人死亡的概率。而他的PN将取决于士兵B有多大可能拒绝开枪或者射失目标。士兵A的射击是必要因,仅限于士兵B不开枪或射失目标这种情况,即在此种情况下,假如士兵A不开枪,那么犯人还将活着。
另一个阐释必要因果关系的典型例子讲述的是在某人划了火柴后发生火灾的故事。对于该例,我们的问题是:是什么引起了火灾,是某人划了火柴还是房间里存在氧气?请注意,这两个因素是同样必要的,因为少了其中任何一个,火灾就不会发生。因此,从纯粹的逻辑角度来看,这两个因素对火灾负有同样的责任。那么,为什么我们更倾向于认为划火柴这个行为而非氧气的存在才是火灾的一个更合理的解释呢?
要回答此问题,请考虑以下两个句子:
(1)假如某人没有划火柴,房子仍将完好无损。
(2)假如屋内不存在氧气,房子仍将完好无损。
这两句陈述都是真的。然而,如果我们被要求判定是划火柴还是氧气导致了房子烧毁,我确信,绝大多数读者都会认为原因是第一个。那么,是什么造成了这种差异呢?
答案显然与事物的常态有关:房子里有氧气很正常,但是我们很难说划火柴这一行为很正常。这种差异无法体现在逻辑中,但它确实体现在我们上面讨论过的两个测度PS和PN中。
如果我们考虑到某个人划火柴的概率远远低于氧气存在的概率,那么经过量化,我们就可以发现,对于划火柴来说,其PN和PS都很高,而对于氧气来说,其PN很高,但PS很低。这就是为什么我们直觉上会将火灾归咎于划火柴而非氧气,而这很可能只是答案的一部分。
1982年,心理学家丹尼尔·卡尼曼和阿莫斯·特沃斯基调查了人们为“撤销”一个并非他们所期望的结果带来的影响所选择的罪魁祸首(“要是……该多好”),并在他们的选择中找到了一致的模式。其中一种模式是,相比于选择一个普通事件,人们更有可能想象一个罕见事件来撤销影响。例如,为了撤销错过约会带来的影响,我们更有可能说,“要是火车准时开就好了”,而不是说“要是火车提前开就好了”。另一种模式是,人们倾向于将结果归咎于自己的行为(比如划火柴),而较少归咎于不受他们控制的事件。我们根据自己构建的关于现实世界的模型估计PN和PS的能力显示出很可能存在一种考量这些要素的系统方法,这就为我们最终教会机器人对特殊事件生成有意义的解释提供了可能。
我们已经看到,PN在法律背景下捕捉“若非”标准背后的基本原理。但是,PS是否应该被纳入刑事法和侵权法的法律考量呢?我认为应该这样做,因为对充分性的关注就意味着对一个人的行为后果的关注。划火柴的人应当可以预料到氧气的存在,而一般来说,没有人会因为预见到划火柴的情景而抽空屋子里的所有氧气。
那么,对于因果关系中的必要成分和充分成分,法律是否应该分别赋予其不同的权重呢?法律领域的哲学家还没有讨论过这个问题的合法性,也许是因为目前PS和PN的概念还没有一个精确的表达式。然而,从人工智能的角度来看,显然PN和PS应该被纳入生成解释的过程。当一个机器人被要求解释火灾发生的原因时,它别无选择,必须同时考虑这两个方面的因素。只关注PN会导致它得出一个站不住脚的结论,即火柴和氧气对火灾的解释同样充分。而给出这种解释的机器人很快就会失去主人的信任。