贝叶斯¶
贝叶斯学派诞生已有两百五十六年的历史,但在很长一段时间当中都不是统计学的主流。在本文中我们会对贝叶斯推理以及贝叶斯定理做出简要介绍。
与前一篇文章一样,让我们先从一个例子开始。
艾滋病
得知艾滋病的发病率(incidence rate)约为0.02583%后,“恐艾症”患者小王去做了艾滋病初筛,并收到了初筛阳性的结果。小王因此夜不能寐、食不知味,直到三天后收到当地疾控中心的电话确认其并没有感染人类免疫缺陷病毒。事实上,刘建礼等的研究结果指出艾滋病初筛阳性样本的总体阳性确诊率为37.6%,其中女性的确诊阳性率仅为6.9%。为了使结果更加直观,对于某发病率为1%(先验信念)的疾病进行一个假阳性率为1%(1%的健康人会响应阳性结果)、假阴性率为0(所有患病人都会响应阳性结果)(后验信念)检测,,我们可以得出如下表格:
健康 | 患病 |
---|---|
0.99 | 0.01 |
健康 | 患病 | |
---|---|---|
阳性 | 0.01 | 1 |
阴性 | 0.99 | 0 |
我们可以根据这些数据,通过贝叶斯定理计算出一个人做该检查的结果概率(证据):
健康 | 患病 | |
---|---|---|
阳性 | 0.44 | 0.56 |
阴性 | 1 | 0 |
似然函数¶
在正式进入贝叶斯定理之前,让我们先了解一下似然。
似然用以针对给定的位置参数测量统计模型与数据样本的拟合优度。
它是由样本的联合概率分布形成的,但是仅作为参数的函数进行查看和使用,因此将随机变量固定为观察值。
尽管似然在频率学派当中应用更多(我相信你总听过最大似然估计),但在贝叶斯学派中似然函数也占据着极为重要的地位。
bayes.pdf