• 精选
  • 会员

do算子和后门标准(2)

2020年7月10日  来源:为什么:关于因果关系的新科学 作者:[美]朱迪亚·珀尔;[美]达纳·麦肯齐 提供人:kangtao76......

游戏4

这个游戏引入了一种新的偏倚,名叫“M偏倚”(以图的形状命名)。同样,该图示中也只有一条后门路径,它已经被B处的对撞阻断,所以我们不需要控制任何事物。然而,1986年之前所有的统计学家以及当下的许多统计学家都认为B是一个混杂因子。它与X(通过X←A→B)相关联,并通过一条不经过X的路径(B←C→Y)与Y相关联。它并不在因果路径上,也不是因果路径上任何变量的后代节点,因为从X到Y没有因果路径。因此,B通过了混杂因子传统的三部分测试。

M偏倚指出了传统方法的错误所在。仅仅因为某个变量与X和Y都相关就将变量(如B)视为混杂因子是错误的。要重申的是,如果我们不控制B,则X和Y就是未被混杂影响的。只有当你控制了B时,B才会变成混杂因子!

20世纪90年代,当我开始向统计学家展示这张图时,他们中的一些人对此付之一笑,说这种图在实践中根本用不上。对此我不赞同!就以游戏4的因果图为例,安全带的使用(B)对吸烟(X)或肺部疾病(Y)没有因果影响,它仅仅反映了一个人对于社会规范的态度(A)与对于安全和健康相关措施的态度(C),而其中一些态度可能会影响此人对于肺部疾病的易感性(Y),另一些态度则可能影响人们是否选择吸烟(X)。在实际数据中,人们发现安全带的使用(B)与X和Y相关。事实上,在2006年一项关于烟草诉讼的研究中,安全带的使用甚至被列为需要控制的首要变量之一。而如果你接受了我在游戏4中给出的模型,那么你就能意识到单独控制B是错的。

请注意,如果你同时还控制了A或C,那么控制B就没什么问题。因为控制对撞因子B打开了“管道”,而控制A或C会再次关闭它。遗憾的是,在安全带的例子中,A和C是与人们的态度有关的变量,很难被直接观测。而如果你不能观测它,你就不能根据它进行统计调整。

游戏5

游戏5在游戏4的基础上额外增加了一点儿难度。现在,我们需要关闭第二个后门路径X←B←C→Y。如果我们通过控制B来关闭这条路径,那么我们就打开了M形路径X←A→B←C→Y。而要关闭这一路径,我们还必须控制A或C。然而,请注意,我们可以仅控制C,这样一来我们就关闭了路径X←B←C→Y,而且不会影响另一条路径。

游戏1至3来自美国国立卫生研究院副院长克拉丽斯·温伯格1993年的一篇论文,文章的标题为“对混杂的更明确定义”。这篇文章发表于1986年至1995这段过渡时期,当时格林兰和罗宾斯的论文已经发表,但人们对因果图仍知之甚少。因此,温伯格在上述的每个案例中都通过一系列计算验证了各个例子的可互换性。尽管她使用了图示来表示不同的情境,但她并没有使用图示的逻辑来帮助她区分混杂因子和去混因子。她是我所知道的唯一设法完成了这一壮举的学者。2012年,她以合著者的身份发表了另一篇升级版的文章,其中她使用因果图分析了同样的例子,并验证了她在1993年那篇论文中得到的所有结论都是正确的。

在温伯格的两篇论文中,作者具体讨论的一个医学案例是估计吸烟(X)对流产或“自发性流产”(Y)的影响。在游戏1中,A代表吸烟引起的潜在身体异常,这是一个不可观察的变量,因为我们不知道异常具体是什么。B代表孕妇的既往流产史。在估计孕妇未来流产的可能性时,流行病学家很容易想到既往流产史这个因素并据其进行统计调整。但在这个例子中,这样做是错误的!如果对B进行了变量控制,我们就部分地阻断了吸烟(X)对流产(Y)的影响通道,从而低估了吸烟的真正影响。

游戏2是这个例子的一个更复杂的版本,其中有两个不同的关于吸烟的变量:X代表孕妇现在是否吸烟(从第二次怀孕开始算起),A代表孕妇第一次怀孕时是否吸烟。B和E是吸烟引起的潜在身体异常,同样,它们是无法被直接观测的,D代表了这些身体异常的其他生理原因。请注意,这个图示考虑到了这样一个事实,即孕妇在怀孕期间可能会改变自己的吸烟行为,但她的其他生理条件并不会改变。许多流行病学家再一次选择根据既往流产史(C)进行统计调整,但这依然是一个糟糕的想法,除非你同时控制了孕妇第一次怀孕时的吸烟行为(A)这一变量。

游戏4和5来自2014年发表的一篇论文,作者是澳大利亚莫纳什大学的生物统计学家安德鲁·福布斯和几位合作者。他感兴趣的是吸烟对成人哮喘的影响。在游戏4中,X代表某人的吸烟行为,Y代表某人是否为成人哮喘患者。B代表此人儿童时期是否患有哮喘,这是一个对撞变量,因为它同时受到父母吸烟行为(A)和潜在的(无法被观测的)哮喘体质(C)的影响。在游戏5中,各个变量含义不变,但福布斯为了让图示更加贴近现实又增加了两个箭头。(游戏4的提出只是为了引入M形结构。)

事实上,福布斯论文中的完整模型包含更多的变量,如图4.7所示。注意,变量A、B、C、X和Y之间的关系与游戏5所示的情况完全一样,从这个角度来说,游戏5被嵌入了这个模型。因此,我们也可以将之前的结论移植过来,即我们必须控制A和B或只控制C,但由于C不可观测,因此它是一个无法控制的变量。此外,我们还有4个新的混杂变量:D=父母是否患有哮喘,E=慢性支气管炎,F=性别,G=社会经济地位。读者可能会发现,我们必须控制E、F和G,而没有必要控制D。如此,对于这个例子而言,去混变量的充分集就是A、B、E、F、G。

图4.7 安德鲁·福布斯的吸烟(X)和哮喘(Y)模型

最后,福布斯发现,在原始数据中,吸烟与成人哮喘的关联很小且统计上不显著。在根据混杂因子进行统计调整后,这一关联变得更小、更不显著了。然而,无效结果无损于这篇论文的质量,因为这篇论文正是“对自然的巧妙询问”的一个典范。

关于这些“游戏”的最后一点评论是:当你开始把变量指定为诸如吸烟、流产这些因素时,显然,这已经不再是游戏,而是严肃的科学研究了。我把它们说成游戏,是因为迅速而有意义地解决它们所带来的喜悦,和一个孩子破解了之前难倒他的谜题时所感受到的那种纯粹的快乐一模一样。

在整个科学研究的生涯中,我们很少能享受到此类令人满足的时刻:将让前辈们困惑不解的问题简化为一个简单的游戏或算法。我认为,混杂问题的完整解决方案是因果革命的主要亮点之一,因为它终结了一整个混乱的时代,我们曾在这个时代做出了许多错误的决策。同时,这又是一场悄无声息的革命,激烈的争辩主要发生在研究实验室中和科学会议上。而在掌握了这些新工具,理解了这些新见解之后,科学界终于可以着手处理一些更困难的问题,无论这些问题是理论上的还是实践中的。我们在后续章节会注重介绍这些内容。

[1]?“treatment group”也可译作“试验组”。本书沿用大卫·弗里德曼等人的名著《统计学》的中文译本(魏宗舒等人译,吴喜之校)对该术语的翻译,统一译为“处理组”。另外,“control group”也有人译作“控制组”,本书采用更常见的译法,即“对照组”。——译者注

[2]?1英里≈1.61千米。——编者注

混杂

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000