機(jī)器學(xué)習(xí)之邏輯回歸算法

已知有n個(gè)特征x_i,我們需要通過這n個(gè)特征進(jìn)行組合建模,最簡(jiǎn)單的即是線性組合,但是這里加入了一個(gè)擾動(dòng)因子(為了模擬真實(shí)場(chǎng)景特征的變化)

為了實(shí)現(xiàn)數(shù)值與概率的映射,我們需要一個(gè)概率函數(shù)將上述線性變化之后的值轉(zhuǎn)換為概率,針對(duì)2分類問題,該概率函數(shù)為sigmoid函數(shù)

針對(duì)2分類問題,分類為1和分類為0的概率分別為

這里我們假設(shè)Y|X服從伯努利分布,由伯努利分布公式可得觀測(cè)概率為

因此可得似然函數(shù)為

下面將根據(jù)公式推導(dǎo)為什么該概率函數(shù)為sigmoid函數(shù)

假定概率函數(shù)具有以下性質(zhì)

eq-1

根據(jù)信息論中定義的最大熵可得

eq-2

從上面的已知條件中,根據(jù)標(biāo)準(zhǔn)的解約束不等式優(yōu)化方法(拉格朗日不等式可得)

eq-3

這里對(duì)不等式求導(dǎo),并令求導(dǎo)的結(jié)果等于0(求取極值)可得

eq-4

求導(dǎo)之后可得

eq-5

化簡(jiǎn)公式之后可得

eq-6

將公式6帶入公式1的條件2中化簡(jiǎn)可得

eq-7

然后將公式7代入公式6可得最終的表達(dá)式(softmax函數(shù))


針對(duì)2分類問題(k=2),化簡(jiǎn)softmax函數(shù)可得(sigmoid函數(shù))


參考文獻(xiàn)

The equivalence of logistic regression and maximum entropy models

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容