條件概率分布與機器學(xué)習(xí)

基本上很多機器學(xué)習(xí)的算法的目標(biāo)函數(shù)都是條件概率分布。所以這里會重點的談?wù)勎覍l件概率分布的理解。?

條件概率分布到底意味著什么呢?

條件概率分布的數(shù)學(xué)表達公式為:P(Y|X)。這里X 和 Y 都是隨機變量。 如何理解該公式呢??

該公式可以理解為:尋找一種觀察結(jié)果的最可能原因

說白了, 就是從結(jié)果反推出原因。 那么哪個是原因? 哪個是結(jié)果?

在條件概率分布中,??X代表結(jié)果, Y代表原因, 這一點非常重要。由于結(jié)果是可觀察的, 所以X是已知變量, Y是要求解的未知變量。

所以條件概率分布可以理解在不確定環(huán)境下的因果推導(dǎo)模型。?

比較常見的例子就是醫(yī)療診斷,醫(yī)生會根據(jù)患者的癥狀(觀察的結(jié)果),推斷出具體病因(原因)。?

如何進行條件概率的推理?

根據(jù)貝葉斯定理,有如下公式:

P(Y| X) = \frac{P(X, Y)}{P(X)}

從貝葉斯推理可知:

只要能求解隨機變量 X, Y的聯(lián)合概率分布,?就可以求得條件概率分布。

如何求解聯(lián)合概率分布?

根據(jù)如下概率公式

P(X, Y) = P(X|Y) * P(Y)= P(x_{1}, x_{2} ... x_{n}| Y ) * P(Y)

在這里X是一個向量。?從上述公式看, 關(guān)鍵在于求解?P(x_{1}, x_{2} ... x_{n}| Y ) 。如果特征變量x_{i} 是布爾類型, 則向量X的取值范圍有2^n , 這個值是指數(shù)級別的,是不可計算的。

所以,有沒有辦法降低計算復(fù)雜度呢??

另辟道路:變量的獨立性

如果假設(shè)?x_{1}, x_{2} ... x_{n}?是互相獨立的, 那么則可以推導(dǎo)出:

P(x_{1}, x_{2} ... x_{n}| Y ) =\prod_{i=1}^n P(x_{i}|Y)

則求解的復(fù)雜度從指數(shù)級降低到了線性。?

但是, 天下沒有免費的午餐。 現(xiàn)實情況中, 隨機變量的絕對獨立性非常少見。 所以,這種計算方法雖然提高了計算效率, 但是降低了對現(xiàn)實模擬的準(zhǔn)確度

所以,有沒有其它辦法,即可提高計算效率, 又不降低精確度呢?

柳暗花明又一村:貝葉斯網(wǎng)絡(luò)

貝葉斯網(wǎng)絡(luò)是機器學(xué)習(xí)的一個重要分支, 在這里不具體展開它。

需要記住一點: 貝葉斯網(wǎng)絡(luò)是和聯(lián)合概率分布是等價的。同時貝葉斯網(wǎng)絡(luò)的計算效率提高不少。

如果想進一步深入了解貝葉斯網(wǎng)絡(luò)的話, 可以參考《概率圖模型原理與技術(shù)[科勒,弗里德曼著]》??

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 以西瓜書為主線,以其他書籍作為參考進行補充,例如《統(tǒng)計學(xué)習(xí)方法》,《PRML》等 第一章 緒論 1.2 基本術(shù)語 ...
    danielAck閱讀 4,888評論 0 5
  • 簡單的來說就是:在Intent或Bundle中無法直接放對象,必須把對象序列化為二進制流才行,傳輸完成后要進行反序...
    無敵未央様閱讀 2,715評論 0 5
  • 《續(xù)千字文》全文采用了1000個不重復(fù)的漢字,而這1000個字,又未曾被《千字文》使用過,其創(chuàng)作難度之高,猶在《千...
    九五農(nóng)村娃閱讀 12,098評論 0 0

友情鏈接更多精彩內(nèi)容