回歸(二)
Logistic 回歸
雖然本小節(jié)的方法叫做Logistic回歸,但是Logistic回歸通常用于解決離散狀態(tài)的分類問題。
Logistic/sigmoid函數(shù)
首先直接給出sigmoid函數(shù)的定義:
我們在線性回歸中使用的使用的預(yù)測函數(shù):,將其直接代入到sigmoid函數(shù)中,并將這個新的函數(shù)作為我們的預(yù)測函數(shù):
sigmoid函數(shù)有一個很好的性質(zhì)就是,它的就到時非常簡單的:
Logistic回歸的優(yōu)化算法
在最簡單的二分類問題中,我們可以將問題簡化為y只能取兩個值:0和1。并且將作為y取1的概率,因此我們可以假設(shè):
因此可以計算所有樣本的似然函數(shù);
取對數(shù)似然函數(shù):
對數(shù)似然函數(shù)對參數(shù)求偏導(dǎo):
因此,根據(jù)極大似然估計,很容易就可以得到學(xué)習(xí)的算法:
其實logistic回歸的學(xué)習(xí)和線性回歸具有相同的形式。在預(yù)測的過程中,我們使用模型來計算的概率,如果超過0.5就預(yù)測
,否則就預(yù)測
。
Logistic回歸的解釋
一個事件發(fā)生的幾率odds,是該事件發(fā)生的概率和該事件不發(fā)生的概率的比值。
我們之前直接把作為y取1的概率,我們來計算一下y取1的對數(shù)幾率:
因此logistic回歸就可以看成是一個廣義的線性回歸,可以解釋為事件
的幾率。反過來我們可以推導(dǎo)出sigmoid函數(shù),如果我們想要構(gòu)造一個模型,是的
的對數(shù)幾率滿足一個線性模型,即:
就得到了sigmoid函數(shù)的形式。以上推導(dǎo),讀者可以自行理解。
Logistic回歸的損失函數(shù)
這里我們對y的取值做一些修改,即:,因此我們可以改寫一下似然函數(shù):
我們令,那么: