我为计算反事实所展示的结构因果模型方法与鲁宾使用的方法不同,其中一个主要区别就是我使用了因果图。因果图允许研究者用他们自己能理解的方式表示因果假设,并把所有的反事实作为其世界模型的一种衍生属性。鲁宾的因果模型则将反事实视为抽象的数学对象,可以借助代数机制来管理,而并不视其为从模型中衍生出来的属性。
由于缺乏图示工具,鲁宾因果模型的使用者通常被要求接受三个假设。第一个非常容易理解,被称为“单位处理效应稳定假设”(stable unit treatment value assumption,简称为SUTVA)。它的意思是,无论其他个体(或“单位”,这是因果建模者的首选术语)接受何种处理,对于每个个体(或“单位”)而言,其处理效应都是稳定不变的。除非我们研究的是流行病和其他集体性感染病,在大部分情况下,这个假设都是合理的。例如,假设头痛不会传染,那么我对阿司匹林的反应就不取决于乔是否服用了阿司匹林。
鲁宾模型中的第二个假设被称为“一致性”,也很容易理解。它指的是,一个自行决定服用阿司匹林并且因此康复了的人,假如他是通过在某个临床试验中接受随机分配的方式服用了阿司匹林,那么他一样会康复。这一合理的假设是结构因果模型框架中的一个定理,它实际上说的是试验不存在安慰剂效应和其他设计缺陷。
但是,从事潜在结果研究的研究者真正需要做出的那个最主要的假设叫作“可忽略性”(ignorability)。这个假设更具技术性,同时也更关键,因为它本质上与我们在第四章讨论的杰米·罗宾斯和桑德·格林兰提出的可互换性条件是一回事。可忽略性用潜在结果变量Yx 表达了同样的要求。给定某组(去)混杂因子Z的值,该假设要求Yx 独立于(对象)实际接受的处理X。在探讨其意义之前,我们必须承认,任何表示为条件独立性的假设都继承了大量由统计学家为普通(非反事实的)变量所建立的数学处理机制,对此我们应该表示感激。例如,统计学家经常会使用某种规则来决定一个条件独立性何时会跟随另一个条件独立性出现。值得赞扬的是,鲁宾认识到了把“未被混杂”这一因果概念翻译成概率语言的好处,尽管这个概念是建立在反事实变量的基础上的。可忽略性假设使得鲁宾因果模型真正成为一个模型,而表8.1就不是一个模型,因为它不包含创建者对世界的假设。
遗憾的是,目前为止我还没发现谁能使用那些需要做出这种假设或需要在给定问题中评估假设合理性的研究者所说的那种语言,解释清楚可忽略性究竟意味着什么。下面是我所能给出的最佳尝试:如果在混杂因子Z的任意一层,本该有潜在结果Yx =y的病人与本该有不同的潜在结果Yx =y'的病人都有同样的可能被分配至处理组或对照组,那么把病人指派给处理组或对照组的做法就是可忽略的。对于那些掌握了关于反事实的概率函数的人来说,这个定义是完全合理的。但是,对于那些只能以本学科的科学知识为指导的生物学家或经济学家,如果他们想要评估可忽略性假设是否合理该怎么做?更具体地说,研究者应当如何评估本书所讨论的例子是否具备可忽略性?
为了说明这件事到底有多困难,让我们尝试将这个解释应用到我们刚刚分析的例子中。为了确定(在以EX为条件的前提下)ED是否是可忽略的,我们需要判断一个潜在工资可能是S1 =s的员工,他是否与另一个有不同的潜在工资S1 =s'的员工有同样的可能具有某一等级的学历水平。如果你认为这一陈述听起来就像循环论证,我也只能同意你的看法!我们想确定爱丽丝的潜在工资,而为此,我们必须在开始估算之前,甚至必须在得到任何一个关于答案的提示之前,就要推测出,在EX的每个层中,潜在结果是依赖于还是独立于ED。这完全是一个认知噩梦。
事实证明,在我们的例子中,在以EX为条件的前提下,ED对于S来说不是可忽略的,这就是为什么匹配法(将伯特和卡罗琳匹配)会产生一个关于潜在工资的错误答案。事实上,两人的潜在工资的估计值差额应为:S1 (伯特)–S1 (卡罗琳)=5000美元。(读者应该能借助表8.1中的数字和三步推导过程得出这一结果。)而现在我要说明的是,在因果图的帮助下,研究者可以立即判断出ED不是可忽略的,因而也就不会去尝试匹配ED。如果没有因果图,研究者就会被表格误导可忽略性假设是默认合理的,从而落入这个陷阱。(这并非主观臆测。此类错误示范是我从《哈佛法律评论》的一篇文章中看到的,其背景故事本质上和图8.3的故事一样,而作者确实使用了匹配法。)
下面,我们来说明如何利用因果图来判断(条件的)可忽略性。以一组匹配变量Z为条件,要确定对于结果Y来说X是否可忽略,我们只需要测试Z是否阻断了X和Y之间的所有后门路径,同时,Z的成员都不是X的后代即可。就这么简单!在我们的示例中,拟匹配变量(工作经验)阻断了所有的后门路径(因为本来就没有任何后门路径),但由于它是“学历”的后代,所以它未通过测试,因此ED就不是可忽略的,EX也就不能用于匹配。无须进行复杂的分析,只需要看一眼因果图,我们就能得出这个结论。并且,研究者也不必再费神去评估在某种处理下潜在结果的存在可能性有多大。
遗憾的是,鲁宾并不认同因果图“有助于因果推断”这一说法。 [5] 因此,遵循了他的建议的研究者就无法进行这个关于可忽略性的测试,他们要么必须进行费时费力的分析,以说服自己假设成立,要么干脆将这一假设看作“黑箱”,默认其正确。事实上,著名的潜在结果研究者马歇尔·乔菲在2010年写道,人们之所以要做出可忽略性假设,通常是因为这类假设证实了使用现有的统计方法是合理的,而不是因为他们真的相信这类假设。
与透明性密切相关的一个概念就是可测试性,这一概念在本书中已经出现过几次。我们可以很容易地测试出以因果图为基础建立的模型与数据的兼容性,而以潜在结果的语言为基础所建立的模型就没有这个特点。这个测试是这样进行的:无论何时,只要图表中X和Y之间的所有路径都被一组节点Z阻断,那么在以Z为条件的前提下,数据中的X和Y就应该是条件独立的。这就是我们在第七章提到的d分离性,这个属性允许我们在数据未能显示出相应的独立性时否定并放弃模型。相比之下,相同的模型如果用潜在结果的语言来表述(其由一系列关于可忽略性的表述组成),我们就会缺乏相应的数学机制用以揭示模型所包含的独立性,因而研究者也就无法对模型进行测试。我很难理解研究者一直以来是如何忍受这种缺陷而无所作为的。我唯一能给出的解释是,他们因为远离图示工具太久,已经忘记了因果模型是而且也应该是可测试的。