• 精选
  • 会员

贝叶斯牧师与逆概率问题(3)

2020年7月10日  来源:为什么:关于因果关系的新科学 作者:[美]朱迪亚·珀尔;[美]达纳·麦肯齐 提供人:kangtao76......

现在让我讨论一下贝叶斯法则的应用层面的异议——在人类逐步退出神学王国,进入科学世界之际,这一条异议可能更重要。如果我们尝试将贝叶斯法则应用到台球难题中,那么为了得到P(L|x),我们就需要一个不能从实际存在的台球桌中得到的量:球桌长度L的先验概率,这一概率同我们想要的P(L|x)一样难以估计。此外,这一概率还因人而异,完全取决于个体对不同长度的台球桌的过往经验。一个从来没见过斯诺克球桌的人很难相信L会超过10英尺。而一个只见过斯诺克球桌,没有见过普通台球桌的人,则会给“L不足10英尺”一个很低的先验概率。这种变异性也被称为“主观性”,有时被看作贝叶斯推理的一个缺陷。但也有一些人认为这是贝叶斯推理的一个强大优势,它允许我们在数学上表达我们的个人经验,并以条理化的、易懂的方式将其与数据结合起来。在普通的直觉不起作用或情绪可能导致我们误入歧途的情况下,贝叶斯法则能引导我们进行正确的推理。我们之后将在一些大家熟悉的场景中展示这种力量。

假设你做了一项体检,想检查一下自己是否得了某种病,而体检结果是阳性的。那么,你有多大可能真的得了这种病?为了明确表述这一问题,我们假设疾病是乳腺癌,你所做的专项体检是乳房X光检测。在这个例子中,前向概率指的是,假设你的确患有乳腺癌,检测结果为阳性的概率:P(检测|疾病)。这一概率也就是医生所说的检测的“敏感度”(sensitivity),或者说是检测手段准确探测到某种疾病的能力。一般来说,这个概率对所有类型的患者来说都一样,因为它只依赖检测仪器探测到与这种疾病相关的异常生理现象的技术灵敏度。逆概率显然是我们更关心的概率,在这个例子中,逆概率指的是:假定检测结果为阳性,检测者确实得了乳腺癌的概率有多大?也就是P(疾病|检测),它表示的是非因果方向的信息流动,根据检测结果推断疾病的概率。这个概率对于不同类型的患者就不一定相同了,因为相比没有这种疾病家族史的病人而言,有相应疾病家族史的病人如得到了阳性的检测结果肯定会引起我们更高的警惕。

请注意,我们现在已经开始讨论因果和非因果方向了。在茶室的例子中我们没有这样做,是因为在那个例子中,点茶或点烤饼哪个在前并不重要,哪个条件概率更容易估算出来才是关键。但因果关系的存在阐明了为什么我们更不情愿评估“逆概率”。贝叶斯在他的文章中明确指出,逆概率问题正是他感兴趣的一类问题。

现在,一位40岁的女性做了乳房X光检查以检测乳腺癌,其得到的检测结果为阳性。假设D(代表“疾病”)指她得了癌症,证据T(代表“检测”)指乳房X光检查的结果。那么,她应该在多大程度上相信这个假设?她应该做手术吗?

我们可以根据贝叶斯法则改写之前的方程来回答这些问题:

(D的更新概率)=P(D|T)=(似然比)×(D的先验概率)(3.2)

新术语“似然比”(likelihood ratio)由P(T|D)/P(T)给定。它衡量的是,该疾病的患者得到阳性检测结果的概率比一般群体要高多少。因此,方程3.2告诉我们的就是,不管先验概率是多少,新证据T都会通过一个固定的比率增加D的概率。

让我们通过下面这个例子说明“似然比”这个重要的概念的具体含义。对于一个典型的40岁女性来说,她在下一年患乳腺癌的概率约为1/700,因此我们就用它作为我们的先验概率。

为了计算似然比,我们需要知道P(T|D)和P(T)。在这个例子中,P(T|D)指的是乳房X光检查的敏感度,即如果你的确得了癌症,检测结果为阳性的概率。根据乳腺癌监测联合会(BCSC)的数据,对于40岁的女性来说,乳房X光检查的敏感度为73%。

分母P(T)的估算略微有些棘手。我们知道,阳性检测结果T既可能来自患这种病的检查者也可能来自没有患这种病的检查者。因此,P(T)应该是P(T|D)(患病者检测结果为阳性的概率)和P(T|~D)(未患病者检测结果为阳性的概率)的加权平均,其中P(T|~D)一般被称为假阳性率。根据BCSC的数据,40岁女性做乳房X光检查的假阳性率约为12%。

为什么我们需要的是加权平均值?因为健康女性(~D)的数量远多于患乳腺癌的女性(D)。事实上,在700名女性中,平均只有1人患有乳腺癌,另外699人则未患乳腺癌。因此,如随机选择1名女性进行检测,则其得到阳性结果的概率应该更容易受到那699名未患乳腺癌的女性的影响,而更少地受到那一个患乳腺癌的女性的影响。

在数学上,加权平均值的计算如下:P(T)=(1/700)×(73%)+(699/700)×(12%)≈12.1%。如此进行权重分配的原因是,700名女性中只有1人有73%的可能性得到阳性检测结果,另外699名则只有12%的可能性得到阳性检测结果。正如你所预期的,P(T)的值非常接近假阳性率。

现在我们得到了P(T),就可以计算D的更新概率了,也就是女性检查者得到阳性检测结果的前提下,其的确患有乳腺癌的可能性。似然比为73%/12.1%≈6。正如我之前所说的,我们可以通过将似然比作为乘数乘以先验概率,来计算这名女性检查者患有癌症的更新概率。对于这名女性检查者而言,由于其先验概率是1/700,因此其更新概率是6×1/700≈1/116。换言之,在拿到阳性检测结果的前提下,这名检查者的确患有癌症的概率还不到1%。

这一结论令人吃惊。我认为,大多数看到她们的乳房X光检查结果为阳性的40岁女性会惊讶地发现她们其实有很高的概率并没有患病。图3.3也许能让你更容易理解原因所在:假阳性结果的数量要压倒性地多于真阳性结果的数量。我们对这一结果的惊讶源于对前向概率和逆概率的认知偏差,即认为前者的得出经过了深入研究,支持资料翔实,而后者的得出则多涉及个人的主观决策。

图3.3 该例中,根据乳腺癌监测联合会提供的假阳性率和假阴性率,在乳腺癌检测结果为阳性的363名40岁女性中,只有3人确实患有乳腺癌(因经过近似处理,图示中的比例与文本中的比例不完全相符)(资料来源:马雅·哈雷尔绘图)

2009年,美国预防服务特别小组建议40岁的女性不应每年进行乳房X光检查。而上文中提到的这种感知和现实之间的冲突在一定程度上解释了人们对这一建议的强烈抗议。特别小组了解很多女性所不了解的事实:对于这个年龄段的女性检测者来说,阳性检测结果更可能是虚惊一场,而不是真的诊断出检测者患有癌症,许多女性因此产生了不必要的恐慌,并忙于寻求获得不必要的治疗。

然而,如果一名40岁的女性检测者本来就携带乳腺癌遗传基因,那么情况就会截然不同——此人在第二年会有1/20的可能性患乳腺癌,其得到阳性检测结果的概率将升至1/3。对符合此种情况的女性来说,检测提供重要警示信息的概率就要高得多了。因此,特别小组继续建议,乳腺癌高危女性仍然应该进行每年一次的乳房X光检查。

这个例子表明,P(疾病|检测)并非对所有人都一样,它取决于具体情况。如果你知道自己本来就有很高的患病风险,那么贝叶斯法则就可以让你把这些信息作为影响因子考虑进去。相反,如果你知道自己具有对于某种疾病的免疫能力,那么根据贝叶斯法则,你就根本不必再费心去做检测了!相比之下,P(检测|疾病)并不取决于你是否属于高危群体,对于这类因素,它是“稳健的”,不会随之发生变化。这也在一定程度上说明了医生使用前向概率组织知识、与患者沟通的原因。前向概率涉及的是疾病本身的性质、发展阶段或检测仪器的灵敏度,其对患病原因(如流行病、饮食、卫生、社会经济地位、家庭史)是不敏感的。逆概率P(疾病|检测)则对这些因素非常敏感。

还记得前一个台球桌例子的读者现在肯定想知道贝叶斯是如何处理P(L)的主观性的。他的解决方案包括两个部分。第一,贝叶斯感兴趣的不是台球桌自身的长度,而是在特定球桌长度下某个未来事件的结果(下一球在桌子某一特定范围内停止的可能性)。第二,贝叶斯假设L机械地取决于从某个更远或更近的距离击球,比如说已知有人从L* 处击球,则我们就可以用L* 来替代L。通过这种方式,他赋予了P(L)以客观性,并将问题转化为从数据中估计先验概率,正如我们在茶室和癌症检测的例子中看到的那样。

从许多层面来说,贝叶斯法则都是对科学方法的提炼。教科书对科学方法的描述是这样的:(1)提出一个假设,(2)推断假设的可检验结果,(3)进行实验并收集证据,(4)更新对假设的信念。通常,教科书涉及的只是简单的正确和错误两种结果的检测和更新,证据要么证实了假设,要么驳斥了假设。但是生活和科学从来不会那么简单!所有的证据都包含一定程度的不确定性。贝叶斯法则告诉我们的正是如何在现实世界中执行步骤(4)。

证据

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000