線性支持向量機
一、產(chǎn)生
通常在數(shù)據(jù)中有些特異點(
outlier),將特異點去掉,剩下的大部分數(shù)據(jù)組成的集合是線性可分的。線性不可分意味著某些點不滿足間隔大于或者等于的約束條件
尤爾小屋
解決辦法:
- 對每個樣本點引入松弛變量
,使得間隔加上松弛變量之后可以滿足大于等于1的約束條件,此時真正的約束條件變成:
,同時對每個松弛變量一個懲罰項
,此時目標函數(shù)從
變成了
- 懲罰參數(shù)
越大,對誤差分類的乘法增大;反之
越小,對誤差分類的懲罰減小
- 目標函數(shù)兩層含義
- 使
盡量小,也就是間隔盡量大
- 誤分類點的個數(shù)盡量少,通過
進行調(diào)和
- 使
二、線性不可分模型支持向量機的原始問題
原始問題是凸二次規(guī)劃問題
通過上述3式子可以求出,從而得到分離超平面
決策函數(shù)為
這樣的模型稱之為訓練樣本不可分時的線性支持向量機。線性支持向量機包含線性可分支持向量機。
三、學習的對偶算法
上面3個式子的對偶問題是
原始最優(yōu)化問題的拉格朗日函數(shù)為其中
學習的對偶問題轉(zhuǎn)變成拉格朗日的極大極小值問題。
- L函數(shù)分別對
求導,令導數(shù)為0,求出三個值
- 再對
求出極大值,可以得到對偶問題:
,求解出
四、對偶形式超平面和決策函數(shù)
分離超平面
決策函數(shù)為
五、支持向量
軟間隔的支持向量或者在間隔邊界上,或者在間隔邊界和分離超平面之間,或者在分離超平面的誤分一側(cè)
-
,則
,支持向量剛好落在了間隔邊界上
-
,則分類正確,支持向量位于間隔邊界和分離超平面之間
-
,則
位于分離超平面誤分一側(cè)
線性支持向量機的三要素
- 模型:分離超平面和決策函數(shù)
- 學習策略:軟間隔最大化
- 學習方法:凸二次規(guī)劃問題
合頁函數(shù)
線性支持向量機學習的另一種解釋為最小化目標函數(shù)上式中,第一項是經(jīng)驗損失或者稱之為經(jīng)驗風險,函數(shù)
稱之為合頁函數(shù)下標"+"表示如下取正值的函數(shù)
當樣本點被正確分類且函數(shù)間隔(確信度)時,損失函數(shù)是0;否則是
。目標函數(shù)的第二項是系數(shù)為
的
的
范數(shù),是正則化項。