混杂和去混杂：或者，消灭潜伏变量（2）

2020年7月10日　　来源：为什么：关于因果关系的新科学　作者：[美]朱迪亚·珀尔；[美]达纳·麦肯齐　提供人：kangtao76......

当一个变量同时影响到选择接受处理的对象以及试验结果时，混杂偏倚就产生了。有时混杂因子是已知的，另一些时候它们只是疑似存在，在分析中以“潜伏的第三变量”出现。在因果图中，混杂因子非常容易识别。在图4.1中，位于这个叉接合中心的变量Z就是X和Y的混杂因子。（稍后我们将看到一个对于混杂因子的更通用的定义，但这个三角形是最容易识别，也是最常见的一种情况。）

图4.1 混杂的最基本形式：Z是X和Y因果关系的混杂因子

“混杂”这一术语在英语中的原意是“混合”，我们可以从图中理解它为什么叫这个名字。在图4.1中，真正的因果效应X→Y与由叉接合X←Z→Y诱导的X和Y之间的伪相关混合在一起。举个例子，假设我们准备测试一种药物，而在试验过程中，我们让比对照组平均年龄更低的一组患者服用了这种药物，那么年龄就成为这一试验的一个混杂因子，或者说潜伏的第三变量。如果我们没有关于年龄的数据，我们将无法从药物的虚假效果中区分出药物的真实效果。

不过，反过来也是正确的。如果我们确实测量了第三变量的数据，那么我们很容易就能区分出真实效果和虚假效果。例如，如果混杂因子Z是年龄，而我们分别比较每个年龄组的处理组（treatment group）和对照组（control group）。?[1]??然后，根据各个年龄组在目标总体中所占的百分比对每个年龄组进行加权，我们就可以计算出药物的平均效果。这种补偿方法是所有统计学家都很熟悉的一种方法，它被称为“Z调整”或“Z控制”。

奇怪的是，统计学家既高估又低估了为可能的混杂因子进行统计调整的重要性。高估它，是指他们经常对过多的变量进行控制，甚至控制了不该控制的变量。最近，我偶然读到来自政治博客作者埃兹拉·克莱因的一段话，他在其中非常清楚地阐述了这种“过度控制”的现象：“你在各种研究中都能看到它。‘我们控制了……’，然后一张关于被控制的变量的列表就开始了，而且这个列表往往被认为越长越好：收入、年龄、种族、宗教、身高、头发颜色、性取向、健身频率、父母的爱、偏好可口可乐还是百事可乐……就好像你能控制的东西越多，你的研究就越有说服力，或者至少看起来如此。控制可以带来专一性和精确感……但有时，你控制的东西过多了，以至于在某些时候，你最终控制了你真正想要测量的东西。”克莱因提出了一个合理的担忧。统计学家对于应该控制和不应该控制哪些变量感到非常困惑，所以默认的做法是控制他们所能测量的一切。当今时代的绝大多数研究都采用了这种做法。这的确是一种可轻松遵循的、便捷的、简单的程序，但它既浪费资源又错误百出。而因果革命的一个关键成果就是终结这种混乱。

同时，统计学家又在很大程度上低估了控制的意义，即他们不愿意谈论因果论，即使他们进行了正确的控制。这也与本章我希望传达的观点相悖：如果你在因果图中确定了去混因子（deconfounder）的充分集，收集了它们的数据，并对它们进行了适当的统计调整，那么你就有权说你已经计算出了那个因果效应X→Y（当然，前提是你可以从科学的角度清楚地阐释并捍卫你的因果图）。

统计学家处理混杂的传统方法则与之截然不同，这些方法大多建基于随机对照试验，这是费舍尔极力主张的观点。这一主张本身完全正确，但费舍尔提出这一主张并不是出于一个完全合理的原因。随机对照试验确实是一项极好的发明——但直到最近，追随费舍尔脚步的几代统计学家仍然无法证明他们从随机对照试验中得到的结果就是他们想要得到的东西。他们缺乏一种语言来说明他们所寻找的东西，也就是X对Y的因果效应。本章的目标之一就是从因果图的角度来解释，为什么随机对照试验能让我们估计出X→Y的因果效应，同时免除混杂偏倚的影响。一旦我们理解了随机对照试验起作用的原因，我们就没有必要再将之奉若神明，把它当作因果分析的黄金标准，要求所有其他方法都必须以此为参照。恰恰相反，我们会领悟到这一统计学家所谓的黄金标准实际上源自更基本的原则。

本章还将阐明，因果图使分析重心从混杂因子向去混因子的转变成为可能。前者引发了问题，后者则解决了问题。这两组因子可能存在部分重叠，但并非必须重叠。如果我们收集到了去混因子充分集的数据，那么即使我们忽略了一部分甚至所有的混杂因子也无关紧要了。

因果革命允许我们超越费舍尔的随机对照试验，通过非试验性研究推断因果效应，其主要途径就来自这种分析重点的转变。它使我们能够确定应该控制哪些变量，使其成为去混因子。这个问题曾让理论统计学家和应用统计学家困扰不已，几十年来，它一直是该领域的一个致命弱点。这是因为混杂与数据或统计学无关，它是一个因果概念，属于因果关系之梯的第二层级。

发明于20世纪90年代的因果图方法已经完全解决了混杂问题。特别是我们很快就会介绍的一种被称为“后门标准”（back-door criterion）的方法，它可以明确识别出因果图中哪些变量是去混因子。如果研究者能够收集到这些变量的数据，那么他就可以对这些变量进行统计调整，从而在不真正实施干预的情况下对干预的结果做出预测。

事实上，因果革命比这走得更远。在某些情况下，即使我们没有去混因子充分集的数据，我们也可以控制混杂。在这些情况下，我们可以使用不同的统计调整公式（不是传统的统计调整公式，因为传统的公式只适用于后门标准）消除混杂。我们将在第七章讲述这些令人振奋的进展。

在几乎所有的科学领域中，混杂都是一个历史悠久的问题，但直到最近，我们才认识到这个问题需要因果的而非统计的方法来解决。直至2001年，某权威期刊的一位审稿人还在批评我的一篇论文时坚称“在标准统计学中，混杂处理有着坚实的理论基础”。幸运的是，这类审稿人的数量在过去10年急剧下降。现在，至少在流行病学、哲学和社会科学领域，研究者已经达成了普遍的共识：（1）混杂需要，也具备一个因果解决方案；（2）因果图提供了一种完整的、系统的方法引领我们找到那个解决方案。我在此宣布，深受混杂困扰的时代已经结束了！

混杂

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。