第15讲 在获得信息之后概率的表示方法 条件概率的基本性质(第3页)
这被称为“贝叶斯公式”。
进行具体计算,则为:
式子(7)可以按照以下思路来理解:左边表示从“黑球”的结果追溯到“B壶”这一原因的概率,从直观上不是很容易理解。而右边的p(A)和p(B)均为每一类别的先验概率,p(黑|A)和p(黑|B)是由原因推导出的结果的概率,这一点已经在设定中予以说明。换言之,式子(7)是通过已知的概率(右边),推导出直观上看不出的概率(左边)的计算方式。
乍一看式子(7),可能会觉得计算过程很复杂,令人迷惑。不过,只要在面积图中填入前面讲过的概率符号,就能明白“现在做的,只是把之前面积图的方法直接转换为计算公式罢了”。
图表15-4贝叶斯逆概率的公式
下面请观察图表15-4。迄今为止,我们采用的计算方式都是在获得“取出的球为黑球”这一信息之后,再得出以下比例关系:
(A的后验概率):(B的后验概率)
=(A&黑球的面积):(B&黑球的面积)
用条件概率来描述,则可以得到如下比例公式:
p(A)p(黑|A):p(B)p(黑|B)…(8)
式子(8)中,左右两边的计算,与通过乘法计算长方形的长宽而得出的概率是一样的。然后,在满足标准化条件的情况下进行变形(左右数值之和相除),得到:
由此又可以得到以下公式:
最后的式子(9),与(7)是完全相同的。
下面,我们通过用来说明条件概率的面积比例的思路,再次进行探讨。
现在,我们已经获得了“取出的球为黑球”这一信息,那么,正如15-2中的解说,B的条件概率即为:在表示“A&黑球”的长方形与表示“B&黑球”的长方形的总和(表示事件“黑球”的情况)中,表示“B&黑球”的长方形所占面积的比例这一数值。而在式子(8)中,左侧为表示“A&黑球”的长方形的面积,右侧为表示“B&黑球”的长方形的面积。因此,用右侧来除以左右之和,其结果,与“在‘取出的球为黑球’的情况下,计算表示‘B&黑球’的长方形面积所占比例”的结果是相同的。这也意味着,最后的计算与条件概率p(B|黑)的面积所代表的意义相一致。
最后需要说明的一点重要内容:采用贝叶斯推理方法计算后验概率时,无须考虑式子(7)中的分母。要点是,因为有了比例公式(8),那么(7)和(9)的分母,只是用来恢复标准化条件罢了,可以忽略。毕竟,关键点在于比例关系。因此我们只需记住比例公式(8)即可。
第15讲·小结
1.条件概率是指,在获得信息之后,基本事件减少的情况下,赋予的比例关系。
2.在获得“事件B”这一信息后,事件A的条件概率p(A|B)可定义为:p(A|B)=p(A和B的重叠部分)÷p(B)
3.在贝叶斯推理中,使用条件概率公式②时有两种方法。
4.第1种使用方法:求出类别&信息的概率。即,p(类别&信息)=p(类别)×p(信息|类别)
5.第2种使用方法:求出后验概率。已知数据信息,通过上面的方法来计算p(类别&信息)的比例关系,并使之满足标准化条件。
练习题
答案参见此处
下面,以癌症检查为例,来练习条件概率的表示方法。
基本事件分别为:“癌症”、“健康”、“阳性”、“阴性”。选取合适的基本事件,填入下面的括号中。
p(癌症&阳性)=p(癌症)×p(|)…(1)
p(癌症&阳性)=p(阳性)×p(|)…(2)
p(健康&阳性)=p(健康)×p(|)…(3)
p(健康&阳性)=p(阳性)×p(|)…(4)
此时,从(1)和(3)中,可以得出:
p(癌症&阳性):p(健康&阳性)
=p(癌症)×p(|):p(健康)×p(|)…(5)
从(2)和(4)中,可以得出:
p(癌症&阳性):p(健康&阳性)
=p(|):p(|)…(6)
从(5)和(6)中,可以得出:
p(|):p(|)
=p(癌症)×p(|):p(健康)×p(|)
左边为后验概率之比,右边为通过先验概率和条件概率中算出来的比值。