现在,我该讲讲自己皈依因果关系科学的故事了,因为在相当长的一段时间,那个令梅兰妮的学生困扰不已的问题也曾使我深受困扰。
我在第四章提到了哈佛大学杰米·罗宾斯(见图9.9)的故事,他和加州大学的格林兰同为统计学和流行病学领域的先驱人物,是当今流行病学广泛采用的图模型方法的主要推动者。从1993年到1995年,我们合作了几年,是他促使我思考序贯干预方案的问题,这一问题也是他的主要研究兴趣之一。
图9.9 杰米·罗宾斯,流行病学领域推动因果推断发展的先驱(资料来源:克里斯·斯尼伯摄,哈佛大学摄像服务部提供)
几年前,作为职业健康安全方面的专家,罗宾斯受邀出庭做证,论证工作场所的化学接触造成工人死亡的可能性。他很沮丧地发现,统计学家和流行病学家没有合适的工具可以用来回答这些问题。那时,因果语言仍然是统计学的禁忌,只有在随机对照试验中研究者才被允许使用这种语言。而出于伦理方面的考虑,人们不可能对接触甲醛造成的影响进行随机化试验。
工厂工人对有害化学物质的接触通常不会只有一次,而应该是长期的。因此,罗宾斯对随时间变化的接触或治疗问题开始产生兴趣。这种接触也有正向的例子:例如,艾滋病的治疗通常要历经数年,后续治疗方案的实施取决于病人体内的CD4细胞数。治疗包含许多阶段,而所有的中介物(你可能想控制这些变量)都取决于上一个治疗阶段,在这种情况下你如何对治疗的因果效应进行区分呢?这是罗宾斯职业生涯的一个关键性问题。
杰米在飞来加州听取了我的“餐巾纸问题”(参见第七章)之后,便对图示方法在序贯治疗方案(也就是他自己的研究领域)中的应用变得非常感兴趣。我们一起想出了一个序贯后门标准,用以估计此类治疗过程的因果效应。我从这次合作中吸取了一些重要的经验。特别是他告诉我,两个行动有时比一个更容易分析,因为行动对应于删除图上的某些箭头,两个行动可以让图示变得更稀疏,更简单。
我们提出的序贯后门标准可以用于分析包含大量do演算的长期处理(治疗)。但即使只有两个操作也足以产生一些有趣的数学运算,包括计算受控直接效应,它由一个“扰动”处理变量取值的操作和一个固定中介物取值的操作组成。更重要的是,直接效应的do演算定义将它们从线性模型的限制中解放出来,并让它们就此扎根于因果运算的土壤。
但直到后来,当我看到人们还在犯一些基本的错误,比如前面提到的中介谬误时,我才真正开始对中介分析产生兴趣。同时,让我感到沮丧的是,基于操作的直接效应的定义没能推广至对于间接效应的定义。正如梅兰妮·沃尔的学生说的,我们没有这样一个或一组可对其进行干预的变量,可以用来关闭直接路径,同时让间接路径保持活跃。因此,间接效应在当时的我看来就像一个虚构的想象,除了提醒我们总效应可能与直接效应不同之外,没有独立的意义。我甚至在《因果论》的第一版(2000)中写下了这些认识,这可以说是我职业生涯中的三大失误之一。
现在回想起来,我当时是被do演算的成功蒙蔽了双眼,它让我盲目地相信,关闭一条因果路径的唯一方法就是取一个变量,将其设置为一个特定值。但事实并非如此。如果我有一个因果模型,通过命令谁何时以及如何听从于谁,我有许多创造性的方式可以用来操纵模型。具体而言,我可以固定主要变量的值以抑制其直接效应,还可以同时假设在主要变量被激活的情况下,赋予中介物一个值以传递主要变量的影响。这使我可以让处理变量(如小猫)取值为0,并将中介物的值设置为处理为1时的值。然后,我的数据生成过程模型就可以告诉我如何计算独立于干预的中介效应。
我很感激《因果论》第一版的一位读者,雅克·哈格那尔斯[《分类纵向数据》(Categorical Longitudinal Data )的作者],他曾激励我不要放弃间接效应。他写信给我说:“许多社会科学专家都在输入数据和输出数据上达成了一致,但对其中涉及的机制则有着完全不同的看法。”但我当时困扰于如何关闭直接效应这个问题,有两年的时间,我的研究一直停滞不前。
而当我读到我在前一章引用的有关歧视的法律定义时,突然之间,我就找到了那个解决方案。那句法律定义是这么说的:“假如雇员除属于不同的种族……外,在其他的一切方面都一样……”就在这句话中,我找到了问题的关键!这就是一个关于虚构的游戏。我们根据每个个体的具体情况进行相应的处理,并让这些个体的特征在处理变量变化之前的水平上保持恒定。
这又能如何解决我的困境呢?首先,这意味着我们必须重新定义直接效应和间接效应。对于直接效应,针对每个个体,我们让中介物“自行选择”在无处理时它本应该有的值,并将其固定在这个值上。现在,我们“扰动”处理变量并记录其所引起的结果的差异。这与我前面讨论过的受控直接效应不同,在后者中,每个个体的中介物都被固定为同一个值,该操作对于所有个体一视同仁。而在这里,因为我们让中介物自行选择它的“自然”值,因此我称之为自然直接效应。类似地,对于自然间接效应,首先,对每个个体我不予处理,然后针对每个个体,我让中介物“自行选择”有处理时它本应该有的值。最后,我记录两个结果的差异。
我不知道对于歧视的法律定义是否像打动了我一样也打动了你或其他人。无论如何,到了2000年,我已经可以熟练自如地谈论反事实了。在学会了如何在因果模型中阅读反事实信息后,我意识到它们也只不过是一些可以通过变动方程或调整因果图中的箭头计算出来的量而已。因此,它们随时可被装入数学公式,而我所要做的就是拥抱这一“假如”世界。
很快,我意识到每一种直接效应和间接效应都可以转化为反事实表达式。一旦我明白了如何做到这一点,在条件许可的时候,我就可以很轻松地推导出一个计算中介效应的公式了。这个公式能告诉你如何根据观测数据估计自然直接效应和自然间接效应,以及它适用于何种情况。重要的是,该公式对X、M、Y之间关系的具体函数形式不做任何假设。自此,我们终于摆脱了线性迷雾,走出了所谓的线性仙境。
我称这个新规则为中介公式,虽然实际上它包含两个公式,一个用于计算自然直接效应,一个用于计算自然间接效应。当其满足因果图所明确、透明地显示出的假设时,它就能告诉你如何根据数据估计出两个效应的值。例如,在类似图9.4的情形中,变量之间没有混杂,M是处理X和结果Y之间的中介物,则自然间接效应为:
NIE=∑m [P(M=m|X=1)–P(M=m|X=0)]×P(Y=1|X=0,M=m) (9.5)
对这一方程的解释颇具启发性。中括号内的表达式代表X对M的影响,乘号后的表达式代表M对Y的影响(当X=0时)。由此,我们就揭示了系数乘积规则的起源,并展示了两个非线性效应的乘积具体应当如何计算。另外还需注意的是,与方程9.3不同,方程9.5没有下标和do算子,因此其结果可以直接根据第一层级的数据估计出来。