基本理論
logistic回歸的總體思路:線性回歸→(激活函數(shù))→線性分類
激活函數(shù)即sigmoid函數(shù),即

logistic回歸模型表達式:

其中?
,
為特征的個分量(維度)
logistic回歸模型只做二分類時,可以看出:

將寫在同一個式子,為:

通常用最大似然估計法,對logistic模型中的參數(shù)進行估計,假設(shè)有N個已知標(biāo)簽的樣本即:

可以看出其實對參數(shù)
進行最大似然估計等價于對交叉熵做最小化
擴展
現(xiàn)在再聊聊聊為什么logistic回歸明明是分類模型但是卻叫回歸:
1.正如開頭所說的logistic回歸用回歸的思路解決分類問題
2.,從這個角度看其實logistic回歸是廣義的線性模型
3.logistic回歸最早是統(tǒng)計學(xué)家David Cox在1958年的《二元序列的回歸分析》中提出,當(dāng)時的回歸概念和現(xiàn)在有點差異,“回歸”這個名字一直沿用至今
將logistic回歸應(yīng)用至多分類:
將logistic回歸應(yīng)用至多分類常用的方法是多項邏輯回歸(Softmax Regrsesion)
Softmax回歸是logistic回歸的一般化,適用于K分類的問題,第K類的參數(shù)為向量,組成的二維矩陣
, n為特征的n個分量(維度)
Softmax回歸概率函數(shù)為:

從這個形式,可以從感性的認(rèn)識看出:Softmax回歸和logistic回歸都是分母是各個類別的和,而分子是特定類別的大小。也就是說Softmax回歸是logistic回歸的一般化。
證明當(dāng)類別數(shù)K=2時,Softmax回歸就是logistic回歸
當(dāng)K=2時,有:

利用參數(shù)冗余的特點,將所有參數(shù)都減去,則上式改寫為:

其中