〇、說明
支持向量機(jī)(Support Vector Machine,SVM)是監(jiān)督學(xué)習(xí)中非常經(jīng)典的算法。筆者主要參考學(xué)習(xí)的是李航老師《統(tǒng)計(jì)學(xué)習(xí)方法(第二版)》[1]和周志華老師的西瓜書《機(jī)器學(xué)習(xí)》[2]。
如有錯(cuò)誤疏漏,煩請(qǐng)指正。如要轉(zhuǎn)載,請(qǐng)聯(lián)系筆者,hpfhepf@gmail.com。
一、問題描述
如此系列筆記的上一篇《支持向量機(jī)(一)——線性可分支持向量機(jī)導(dǎo)出》[3]所述,給定線性可分訓(xùn)練數(shù)據(jù)集,其中
,
,
。
求解如下優(yōu)化問題的最優(yōu)解
優(yōu)化問題一:
可得最大間隔分離超平面
和對(duì)應(yīng)的分類決策函數(shù)
二、朗格朗日對(duì)偶算法
優(yōu)化問題一(式)是一個(gè)凸二次規(guī)劃問題,可以通過求解拉格朗日對(duì)偶問題來求解。關(guān)于凸優(yōu)化內(nèi)容可以參見筆者相關(guān)筆記。
構(gòu)建拉格朗日函數(shù)
其中,為拉格朗日乘子組成的向量。
原問題是凸優(yōu)化問題,則拉格朗日強(qiáng)對(duì)偶性成立,所以如下優(yōu)化問題和原優(yōu)化問題等價(jià),具體請(qǐng)參見[4]
優(yōu)化問題二:
也就是說,優(yōu)化問題二的最優(yōu)解,即是優(yōu)化問題一的最優(yōu)解。
三、求解拉格朗日對(duì)偶問題
第一步,先求解
對(duì)拉格朗日函數(shù)分別對(duì)和
求偏導(dǎo),并令其等于0。
可得
將式和
式代入拉格朗日函數(shù)(
式)
也即
第二步,求解對(duì)偶問題
由式和
式,可得
優(yōu)化問題三:
這就是線性可分支持向量機(jī)的對(duì)偶優(yōu)化問題。求解此優(yōu)化問題請(qǐng)參見此系列筆記的后續(xù)篇章(敬請(qǐng)期待)。
第三步,求解分類超平面和分類模型
當(dāng)求解優(yōu)化問題三(式)的最優(yōu)解為
,根據(jù)式
可得
接下來求解截距的最優(yōu)解
。
根據(jù)凸優(yōu)化問題的KTT條件:優(yōu)化問題一(式)是凸優(yōu)化問題,則滿足KKT條件的點(diǎn)是原問題和對(duì)偶問題的最優(yōu)解(具體請(qǐng)參見[4])。
由式也可得出式
。
將式單獨(dú)拿出來,在
中選擇一個(gè)
(支持向量),則有
將式代入式
,對(duì)于任一
,有
到此,對(duì)于已經(jīng)求出優(yōu)化問題的朗格朗日乘子的最優(yōu)解,則線性可分支持向量機(jī)的最優(yōu)超平面為
的參數(shù)為
此時(shí),分類模型為式。
四、支持向量
將上面KKT條件的式單獨(dú)拿出來
當(dāng)時(shí),則有
對(duì)應(yīng)的樣本都在間隔邊界上,如下圖

再觀察式,當(dāng)
時(shí),對(duì)應(yīng)的樣本是不參與參數(shù)計(jì)算的。
綜上,線性可分支持向量機(jī)是強(qiáng)依賴于離分類超平面最近的樣本點(diǎn)的,這和基于概率統(tǒng)計(jì)的分類方法是不同的。
五、附錄
A、參考
[1]、《統(tǒng)計(jì)學(xué)習(xí)方法(第二版)》,李航著,清華大學(xué)出版社
[2]、《機(jī)器學(xué)習(xí)》,周志華著,清華大學(xué)出版社
[3]、《支持向量機(jī)(一)——線性可分支持向量機(jī)導(dǎo)出》
[4]、《凸優(yōu)化(八)——Lagrange對(duì)偶問題》
B、相關(guān)目錄
[a]、支持向量機(jī)(一)——線性可分支持向量機(jī)導(dǎo)出
[b]、支持向量機(jī)(二)——線性可分支持向量機(jī)求解
C、時(shí)間線
2020-06-01 第一次發(fā)布
2020-06-02 添加《支持向量》部分
2020-06-06 修改圖片來源