无论你是一位致力于实验室研究的科学家还是一个正在学骑自行车的儿童,发现自己在今天做到了昨天还做不到的事总是令人兴奋的。这就是我第一次写下中介公式时的感受。在这个公式中,我可以一目了然地看到有关直接效应和间接效应的一切:使它们变大或变小都需要什么,什么时候我们可以从观察或干预数据中估计它们,什么时候我们可以认为一个中介物要对将观察到的变化传递给结果变量这件事“负责”。因果关系可以是线性的或非线性的,数值的或逻辑的。在过去,为讨论这些例子,我们必须对每一种情况采用不同的方式进行处理。而现在,我们只需要一个公式就足够了。有了正确的数据和正确的模式,我们就可以确定一家公司的招聘政策是否存在性别歧视,或者什么样的混杂因子会阻止我们做出这一判断。从巴巴拉·伯克斯的数据中,我们可以估计出子女智商有多少来自先天遗传,有多少来自后天培养。我们甚至可以计算出总效应中的哪些可以由中介变量来解释(explained),哪些是由中介变量引起的(owed to)——这是两个相互补充的概念,而在线性模型中,二者重叠为一。
在写下了直接效应和间接效应的反事实定义之后,我得知我并不是提出这一想法的第一人。早在1992年,罗宾斯和格林兰就先于我想到了这种方法。但他们的论文只用日常语言描述了自然效应的概念,没有将它写成数学公式。
更遗憾的是,他们对整个自然效应的概念持悲观看法,并指出这种效应不能从试验性研究中估计出来,当然更不能从观察性研究中估计出来了。这一说法阻止了其他研究者发现自然效应所具有的巨大潜力。很难判断,如果罗宾斯和格林兰多走一步,借助反事实语言将自然效应转化为一个公式表示,他们是否能对这一概念有一个更乐观的看法。对我来说,这多走的一步至关重要。
他们的悲观可能另有原因,对此我并不认同,但会尝试解释一下。他们研究了自然效应的反事实定义,并且看到了它能结合来自两个不同世界的信息,在一个世界中,你将处理设置为常量0,在另一个世界中,你将中介物设置为当处理变量的值为1时它本应该取的值。因为你不能在任何试验中复制这一“跨世界”的比较,所以他们认为这种方法是不可能的。
这是他们所属的学派与我的学派之间存在的哲学层面的差异。他们认为因果推断的合法性存在于尽可能严密地复制随机化试验,其背后的假设为,这是通向科学真理的唯一途径。而我相信,一定还存在其他通往真理的途径,它们的合法性来自数据的组合和已有的(或假设的)科学知识。因此,基于第三层级的假设,比随机化试验更强大的方法是可能存在的,而我会毫不犹豫地使用它们。他们为后来者亮红灯的地方,正是我为他们亮绿灯的地方,这个绿灯就是中介公式:如果你对这些反事实假设感到满意,你就能写下中介公式!不幸的是,罗宾斯和格林兰亮出的红灯使中介分析研究停滞了整整9年。
许多人觉得这些公式令人望而生畏,把它们看作隐藏信息而非揭露信息的一种方式。但是对于一个数学家,或者对于一个接受过充分数学思维训练的人来说,情况恰恰相反。公式揭示了一切——没有留下任何一处疑问或含糊。在阅读一篇科学文章时,我经常会发现自己从一个公式跳到另一个公式,而完全跳过了中间的文字叙述。对我来说,公式是一个成熟的想法,而文字是不成熟的想法。
一个公式通常服务于两个目的,一是实用目的,二是社会目的。从实用的角度来看,我的学生或同事可以像读菜谱一样读它。一份菜谱可能简单也可能复杂,但无论如何,它都向你承诺,如果你按照其展示的步骤逐一执行,你就一定可以估算出自然直接效应和自然间接效应,当然,前提是你的因果模型准确地反映了真实的世界。
第二个目的比较微妙。我在以色列有个朋友,他是一位著名的艺术家。我曾到他的工作室去买他的画,他的画作在房间中堆得到处都是——床下有100多幅,厨房里有几十幅。差不多每幅画的定价都在300到500美元之间,我一直没想好到底买哪一幅。最后,我指着他挂在墙上的一幅画,说:“我喜欢这个。”“这幅5000美元。”他说。“怎么这幅这么贵?”我问,部分出于惊讶,部分出于表达抗议。而他回答说:“这个是有框的。”我花了几分钟才理解了他的意思。并非因为配了框它才值钱,而是因为它很值钱所以才被拿出来配了画框。在他公寓里数以百计的画作中,那一幅是他个人的最爱。那幅画充分地表达了他在他的其余画作中一直试图表达的东西,因此,为了展现它的完美,他为它配了画框。
这就是公式的第二个目的,它表示的是一种社会契约。它为某个想法配了一个框,并且声明:“这就是我认为特别重要的东西,它值得被分享。”
这就是我选择推导出中介公式的原因所在。作为一个成熟的思想,它值得被分享,因为对我和许多像我这样的人来说,它标志着困扰了学界一个世纪的难题的最终解决。它是重要的,因为它提供了一个实用的工具,用以识别作用机制并评估其重要性。这就是中介公式给出的社会承诺。
自此,在人们终于确认了非线性中介分析完全可行之后,该领域的研究便突飞猛进地发展起来。如果你去学术文章的数据库搜索标题中包含“中介分析”这一关键词的论文,你会发现在2004年之前,这样的论文几乎不存在。而2004之后的第一年就出现了7篇论文,然后是10篇、20篇,现在每年都超过100篇。我想以接下来的三个例子来结束本章,希望用这些例子来说明中介分析的各种可能性。