2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > 破解逆概率的迷思

破解逆概率的迷思

时间:2019-12-13 02:23:05

相关推荐

破解逆概率的迷思

1

假设你做了一项体检,想检查一下自己是否得了某种病,而体检结果是阳性的。那么,你有多大可能真的得了这种病?

为了明确表述这一问题,我们假设疾病是乳腺癌,你所做的专项体检是乳房X光检测。在这个例子中,前向概率指的是,假设你的确患有乳腺癌,检测结果为阳性的概率:P(检测|疾病)。这一概率也就是医生所说的检测的“敏感度”(sensitivity),或者说是检测手段准确探测到某种疾病的能力。一般来说,这个概率对所有类型的患者来说都一样,因为它只依赖检测仪器探测到与这种疾病相关的异常生理现象的技术灵敏度。

2

逆概率显然是我们更关心的概率,在这个例子中,逆概率指的是:假定检测结果为阳性,检测者确实得了乳腺癌的概率有多大?也就是P(疾病| 检测),它表示的是非因果方向的信息流动, 根据检测结果推断疾病的概率。这个概率对于不同类型的患者就不一定相同了,因为相比没有这种疾病家族史的病人而言,有相应疾病家族史的病人如得到了阳性的检测结果肯定会引起我们更高的警惕。

现在,一位40 岁的女性做了乳房X 光检查以检测乳腺癌,其得到的检测结果为阳性。假设D(代表“疾病”)指她得了癌症,证据T(代表“检测”)指乳房X 光检查的结果。那么,她应该在多大程度上相信这个假设?她应该做手术吗?

我们可以根据贝叶斯法则改写之前的方程来回答这些问题:

( D 的更新概率)= P(D | T)=(似然比)×(D 的先验概率)

3

新术语“似然比”(likelihoodratio)由 P(T | D)/ P(T)给定。它衡量的是,该疾病的患者得到阳性检测结果的概率比一般群体要高多少。因此,方程3.2 告诉我们的就是,不管先验概率是多少,新证据T 都会通过一个固定的比率增加D 的概率。

让我们通过下面这个例子说明“似然比”这个重要的概念的具体含义。对于一个典型的40 岁女性来说,她在下一年患乳腺癌的概率约为1/700, 因此我们就用它作为我们的先验概率。

为了计算似然比,我们需要知道P(T | D) 和P(T)。在这个例子中, P(T | D)指的是乳房X 光检查的敏感度,即如果你的确得了癌症,检测结果为阳性的概率。根据乳腺癌监测联合会(BCSC)的数据,对于40 岁的女性来说,乳房X光检查的敏感度为73%。

分母P(T)的估算略微有些棘手。我们知道,阳性检测结果T 既可能来自患这种病的检查者也可能来自没有患这种病的检查者。因此,P(T) 应该是P(T | D)(患病者检测结果为阳性的概率)和P(T | ~D)(未患病者检测结果为阳性的概率)的加权平均,其中P(T | ~D)一般被称为假阳性率。根据BCSC的数据,40岁女性做乳房X光检查的假阳性率约为12%。

为什么我们需要的是加权平均值?因为健康女性(~D)的数量远多于患乳腺癌的女性(D)。事实上,在700名女性中,平均只有1人患有乳腺癌,另外699人则未患乳腺癌。因此,如随机选择1名女性进行检测,则其得到阳性结果的概率应该更容易受到那699名未患乳腺癌的女性的影响,而更少地受到那一个患乳腺癌的女性的影响。

在数学上,加权平均值的计算如下:

P(T) = (1/700)×(73%)+(699/700)×(12%)≈12.1%

如此进行权重分配的原因是,700名女性中只有1人有73%的可能性得到阳性检测结果,另外699名则只有12%的可能性得到阳性检测结果。正如你所预期的,P(T)的值非常接近假阳性率。

现在我们得到了P(T),就可以计算D的更新概率了,也就是女性检查者得到阳性检测结果的前提下,其的确患有乳腺癌的可能性。似然比为73%/12.1% ≈ 6。正如我之前所说的,我们可以通过将似然比作为乘数乘以先验概率,来计算这名女性检查者患有癌症的更新概率。对于这名女性检查者而言,由于其先验概率是1/700,因此其更新概率是6×1/700≈ 1/116。换言之,在拿到阳性检测结果的前提下,这名检查者的确患有癌症的概率还不到1%。

4

这一结论令人吃惊。我认为,大多数看到她们的乳房X光检查结果为阳性的40岁女性会惊讶地发现她们其实有很高的概率并没有患病。图3.3也许能让你更容易理解原因所在:假阳性结果的数量要压倒性地多于真阳性结果的数量。我们对这一结果的惊讶源于对前向概率和逆概率的认知偏差,即认为前者的得出经过了深入研究,支持资料翔实,而后者的得出则多涉及个人的主观决策。

图3.3 该例中,根据乳腺癌监测联合会提供的假阳性和假阴性率,在乳腺癌检测为阳性的363名四十岁女性中,只有3人确实患有乳腺癌。(因四舍五入,该比例与文本的不完全匹配。)(来源:《为什么:关于因果关系的新科学》)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。