6. 支持向量機(jī)
6.1. 間隔與支持向量
分類學(xué)習(xí)最基本的想法就是基于訓(xùn)練集 在樣本空間中找到一個(gè)劃分超平面,將不同類別的樣本分開。
支持向量機(jī)找到的劃分超平面所產(chǎn)生的分類結(jié)果是最魯棒的,對(duì)未見示例的泛化能力最強(qiáng).
超平面
維空間的超平面定義:
- 超平面方程不唯一;
- 法向量
和位移項(xiàng)
確定唯一的超平面;
- 法向量
為法向量,垂直于超平面,決定了平面方向,
為位移項(xiàng),確定超平面與原點(diǎn)之間的距離;
- 法向量
指向的一半空間為正空間(代入定義方程是 > 0 的),另一半為負(fù)空間(代入定義方程是 < 0 的);
- 任意點(diǎn)到超平面的距離為:
幾何間隔

數(shù)據(jù)集的幾何間隔:數(shù)據(jù)集中所有樣本點(diǎn)的幾何間隔的最小值。
支持向量機(jī)
給定線性可分?jǐn)?shù)據(jù)集 ,支持向量機(jī)希望求得數(shù)據(jù)集
關(guān)于超平面的幾何間隔
達(dá)到最大的那個(gè)超平面,再加上階躍函數(shù)實(shí)現(xiàn)分類功能。
- 當(dāng)超平面未正確劃分樣本時(shí),幾何間隔最小的為誤分類點(diǎn),
;
- 當(dāng)超平面正確劃分時(shí),
,且越靠近中央位置,
越大,進(jìn)而達(dá)到幾何間隔最大。
給定線性可分?jǐn)?shù)據(jù)集 ,設(shè)
中幾何間隔最小的樣本為
,則支持向量機(jī)尋找超平面的過程,可轉(zhuǎn)換為帶約束的優(yōu)化問題。

做出一定的限制,使得該優(yōu)化問題有可解的唯一解,在 SVM 中,通常令幾何間隔為 1.

為方便計(jì)算,將最大化問題轉(zhuǎn)化為最小化問題。

6.2. 對(duì)偶問題
支持向量機(jī)是約束優(yōu)化問題。
拉格朗日對(duì)偶的基礎(chǔ)知識(shí)
對(duì)一般的約束優(yōu)化問題,有 個(gè)不等式約束,有
個(gè)等式約束。
定義域?yàn)椋?img class="math-inline" src="https://math.jianshu.com/math?formula=D%3D%5Coperatorname%7Bdom%7D%20f%20%5Ccap%20%5Cbigcap_%7Bi%3D1%7D%5E%7Bm%7D%20%5Coperatorname%7Bdom%7D%20g_%7Bi%7D%20%5Ccap%20%5Cbigcap_%7Bj%3D1%7D%5E%7Bn%7D%20%5Coperatorname%7Bdom%7D%20h_%7Bj%7D" alt="D=\operatorname{dom} f \cap \bigcap_{i=1}^{m} \operatorname{dom} g_{i} \cap \bigcap_{j=1}^{n} \operatorname{dom} h_{j}" mathimg="1">
可行集為:,可行集是定義域的子集
最優(yōu)值為:
根據(jù)拉格朗日函數(shù)的定義,優(yōu)化問題的拉格朗日函數(shù)為:
其中, 為拉格朗日乘子向量。
定義拉格朗日對(duì)偶函數(shù),是關(guān)于拉格朗日乘子 和
的函數(shù),與
無關(guān)。
拉格朗日對(duì)偶函數(shù) 是拉格朗日函數(shù)
關(guān)于
的下確界。
- 不管優(yōu)化問題是否是凸優(yōu)化問題,其對(duì)偶函數(shù)恒為凹問題。
- 當(dāng)不等式拉格朗日乘子
時(shí),
構(gòu)成了上述優(yōu)化問題最優(yōu)值
的下界。
將上述約束優(yōu)化問題轉(zhuǎn)換為對(duì)偶問題
主問題不好求解時(shí),使用對(duì)偶問題來求解。
設(shè)該優(yōu)化問題的最優(yōu)值為 ,顯然
,稱為“弱對(duì)偶性”成立,若
,稱為”強(qiáng)對(duì)偶性”成立,此時(shí)找到了求
的方法。
KKT 條件

支持向量機(jī)的主問題和對(duì)偶問題

6.3. 核函數(shù)
將樣本從原始空間映射到一個(gè)更高維的特征空間,使得樣本在這個(gè)特征空間內(nèi)線性可分.
如果原始空間是有限維,即屬性數(shù)有限,那么一定存在一個(gè)高維特征空間使樣本可分。
令 是
映射后的特征向量,在特征空間中劃分超平面所對(duì)應(yīng)的模型為:
給出對(duì)應(yīng)的優(yōu)化問題:
及對(duì)應(yīng)的對(duì)偶問題:
設(shè)計(jì)到計(jì)算 ,這是兩個(gè)樣本映射到特征空間之后的內(nèi)積,特征空間的維數(shù)可能很高。
設(shè)想一個(gè)函數(shù),有 ,即
與
在特征空間的內(nèi)積等于它們?cè)谠紭颖究臻g中通過函數(shù)
計(jì)算結(jié)果。推導(dǎo)后,有,
函數(shù) 為核函數(shù)。
什么樣的函數(shù)可以做核函數(shù)?

常用核函數(shù)

還可以通過組合得到,
- 線性組合
- 直積
- 對(duì)任意函數(shù)的運(yùn)算