條件概率
首先,理解這兩個公式的前提是理解條件概率,因此先復習條件概率。
P(A|B)=P(AB)P(B)
理解這個可以從兩個角度來看。
第一個角度:在B發(fā)生的基礎上,A發(fā)生的概率。那么B發(fā)生這件事已經是個基礎的條件了,現(xiàn)在進入B已經發(fā)生的世界,看看A發(fā)生的概率是多少。那么分子就是B發(fā)生A也發(fā)生,分母就是B這個世界發(fā)生的概率了。分母如果是1,那么成了什么意思呢?
另一個角度是看韋恩圖。這里A在B發(fā)生的基礎上發(fā)生的概率是A和B交集的陰影部分面積占用B的比例。
那么由條件概率出發(fā),看一下變形出來的乘法公式:
P(AB)=P(A)?P(B|A)=P(B)?P(A|B)
也可以提供上面的兩個角度來理解這個公式,雖然可以由上面的直接推導,但是我們認為這是問題的思考的不同角度,不僅僅是公式之間的運算。
一:AB同時發(fā)生的概率是在A基礎上發(fā)生B的概率乘以A本身在外部發(fā)生的概率,也是B基礎上發(fā)生A的概率乘以B本身在外部發(fā)生的概率.
二:AB表示的是陰影部分的面積占用A或者B的比例關系。
僅僅從形式上說,豎線后面的要在前面多乘以一個以達到平衡。
全概率
然后再看全概率公式。
一個別人舉的例子:
一個村子與三個小偷,小偷偷村子的事件兩兩互斥,求村子被偷的概率。
解釋:假設這三個小偷編號為A1,A2,A3;
偷東西的事件標記為B,不偷的話標記為:B^
那么被偷的概率就是:要么是A1,要么是A2,要么是A3,
如果是A1, 概率是什么呢?首先得是A1,其次是村子被偷,也即是兩個事件都滿足,所以是P(A1B)
同理,可以得到P(A2B),P(A3B)
又因這三個小偷兩兩互斥,表示不會同時去偷。所以被偷的概率是:
P(B)=P(A1B)+P(A2B)+P(A3B)
當然按照條件概率或者乘法公式展開:
P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3) (*)
PS: P(Ai),P(B|Ai)是已知的
問:是不是有想展開為:
P(B)=P(B)P(A1|B)+P(B)P(A1|B)+P(B)P(A1|B)的沖動?
當然這個式子是沒錯的,但是體現(xiàn)不了這個問題的解法:分階段。
(*)式子體現(xiàn)的是問題分為兩個階段:
1)選人,分割問題
2)計算分割的子問題的條件概率
對應的這里來便是:
1)選小偷,誰去偷
2)選定的小偷作為條件,那么他去偷的條件概率是什么
所以將問題拆解為階段的問題便是全概率公式針對的問題。
貝葉斯公式
貝葉斯公式有意思極了,簡單說就是逆全概公式。
前面是問總體看來被偷的概率是多少,現(xiàn)在是知道了總體被偷了這件事,概率并不知道,問你個更有意思的問題,像是偵探斷案:是哪個小偷的偷的,計算每個小偷偷的概率。
這個特性用在機器學習,人工智能領域相當好用。
也就是求:P(Ai|B)=P(AiB)P(B)
Ai:小偷i干的;B:村子被偷了
首先是一個淳樸的條件概率的展開。
分母里出現(xiàn)了P(B),剛剛討論的全概公式拿來用一用!
而P(AiB)=P(Ai)?P(B|Ai)
對應到上面的例子就鮮活一些:村子被偷了,求Ai偷的概率。
自然現(xiàn)在條件是P(B),分子變形為P(AiB)=P(Ai)?P(B|Ai),是因為假定就是Ai偷的,這是一個已知的概率。
分母P(B)=∑ni=1P(Ai)P(B|Ai)
除了上面的思路外,通常需要注意的是分階段意味著時間的先后。在先進行的事件的基礎上進行后面的事件,就很容易計算概率:P(AB)=P(A)P(B|A)這種。
所以當我們需要計算先驗概率,即先發(fā)生的時間的概率時,總是想著用上面的這個類型來計算,且是通過條件概率進行過渡。