极品少妇日韩一区三区,亚洲一区第一

基本概念

劃分超平面：通過一個線性方程來分類訓練樣本

支持向量：使劃分超平面的劃分結(jié)果正確的距離超平面最近的訓練樣例

間隔：兩個異類支持向量到超平面的距離之和

SVM（支持向量機）基本型

如何為這個分類學習器找到一個超平面

按照一貫的先限定模型，再用訓練樣本和算法確定參數(shù)的方法，我們先為劃分超平面限定一個模型

X是多個不同屬性的值構成的向量

W是為每個屬性賦予的權重值所構成的向量

b為位移項，決定了超平面與原點之間的距離

所以這個超平面可擴展為

在能將訓練樣本分類正確的前提下找到對訓練樣本局部擾動容忍性(最魯棒)的超平面

我們需要運算一個條件極值

當這個超平面使各類訓練樣本集到它的距離之和最大時，該超平面作為閾值最合適，但為了使樣本被正確分類我們還需要一個約束條件。

樣本空間中任意點到超平面的距離可由平面內(nèi)點到直線的距離公式推廣而來

分母為向量w的模

我們?nèi)藶橐?guī)定被劃分為正類的標志值為1，負類為-1

被劃分正確的訓練樣本滿足

(一個訓練集線性可分）

當我們令

兩個異類支持向量到超平面的距離和

所以該目標超平面滿足條件

為了方便計算，等價于

（svm的基本型）

求解這個基本型可得到滿足條件的參數(shù)w和b，即正確且唯一的模型

如何求解

二次規(guī)劃問題：目標函數(shù)二次項，限制條件一次項

而svm的基本型很明顯就是一個二次規(guī)劃問題，我們采用拉格朗日乘子法求解

因此我們可以得到關系式

把關系式代入原拉格朗日函數(shù)

因此求解原問題就變成了求解對偶問題

而原模型可根據(jù)關系式變形為

由于原問題有不等式約束，所以其對偶問題需要增加KKT條件

顯然，這個條件的解為

觀察剛剛得到的線性模型表達式可知，最終模型僅與支持向量有關。

通用的二次規(guī)劃算法不夠高效，在這里我們

采用SMO：先固定兩個乘子之外的所有參數(shù)，然后求這兩個乘子上的極值.為什么是兩個而不是一個，因為我們之前計算出當原函數(shù)值最大時所有乘子和其對應標志值的乘積之和為0，所以如果每次選擇一個作為變量，則這個乘子可由其他已經(jīng)被固定的乘子導出。

如何選取這兩個參數(shù)

直觀來看，KKT 條件違背的程度越大，則變量更新后可能導致的目標函數(shù)值減幅越大.也就是逼近解的速度越快，第二個變量應選擇一個使目標函數(shù)值減小最快的變量，但由于比較各變量所對應的目標函數(shù)值減幅的復雜度過高，因此 SMO 采用了一個啟發(fā)式:使選取的兩變量所對應樣本之間的間隔最大. 種直觀的解釋是，這樣的兩個變量有很大的差別，與對兩個相似的變量進行更新相比，對它們進行更新會帶給目標函數(shù)值更大的變化.

用約束條件