亚洲无码骚,黄色片,日韩,九九这里有精品

轉(zhuǎn)自微信公眾號：機(jī)器學(xué)習(xí)算法與Python學(xué)習(xí)

統(tǒng)計學(xué)習(xí)方法 & 小象學(xué)院

SVM算法優(yōu)點：

可用于線性/非線性分類，也可以用于回歸

低泛化誤差

容易解釋

計算復(fù)雜度低

缺點：

對參數(shù)和核函數(shù)的選擇比較敏感

原始SVM只比較擅長處理二分類問題

它的基本模型是定義在特征空間上的間隔最大的分類器，間隔最大使它有別于感知機(jī)。

SVM還包括核技巧，這使它成為實質(zhì)上的非線性分類器。

支持向量機(jī)的學(xué)習(xí)策略就是間隔最大化，可以形式化為一個求解凸二次規(guī)劃的問題，也等價于正則化的合頁損失函數(shù)的最小化問題。

支持向量機(jī)的學(xué)習(xí)算法是求解凸二次規(guī)劃的最優(yōu)化算法

方法包括：

1. 線性可分支持向量機(jī)

2. 線性支持向量機(jī)

3. 非線性支持向量機(jī)

線性可分時，通過硬間隔最大化，當(dāng)數(shù)據(jù)近似線性可分時，通過軟間隔最大化，當(dāng)訓(xùn)練數(shù)據(jù)線性不可分時，通過使用核技巧及軟間隔最大化

通過核函數(shù)可以學(xué)習(xí)非線性支持向量機(jī)，等價于隱式地在高維特征空間中學(xué)習(xí)線性支持向量機(jī)。這樣的方法稱為核技巧

關(guān)鍵點：支持向量機(jī)、核函數(shù)、序列最小優(yōu)化算法SMO

一、線性可分與硬間隔最大化

假設(shè)輸入空間與特征空間為兩個不同的空間。輸入空間為歐式空間或離散集合，特征空間為歐式空間或希爾伯特空間。假設(shè)這兩個空間元素一一對應(yīng)并將輸入空間中的輸入映射為特征空間中的特征向量。

非線性支持向量機(jī)利用一個從輸入空間到特征空間的非線性映射將輸入映射為特征向量。所以輸入都是由輸入空間轉(zhuǎn)換到特征空間，支持向量機(jī)的學(xué)習(xí)是在特征空間進(jìn)行的。

? ? ?假設(shè)給定一個特征空間上的訓(xùn)練數(shù)據(jù)集

其中xi為第i個特征向量，yi為xi類的標(biāo)記。學(xué)習(xí)目標(biāo)是在特征空間中找到一個分離超平面，wx+b=0

一般地，當(dāng)訓(xùn)練數(shù)據(jù)線性可分時，存在無窮個分離超平面可將兩類數(shù)據(jù)正確分開，感知機(jī)利用誤分類最小策略，求得分離超平面，這時的解也是無窮多個的，因為解和初始解的選擇和步驟有密切關(guān)系。

而線性可分支持向量機(jī)利用間隔最大化求最優(yōu)分離超平面，這時解是唯一的。

--函數(shù)間隔與幾何間隔

一般來說，一個點距離分離超平面的遠(yuǎn)近可以表示為分類預(yù)測的準(zhǔn)信度，在超平面wx+b=0確定的情況下，|wx+b|能夠相對地表示點x距離超平面的遠(yuǎn)近。所以可以用y（wx+b）來表示分類的正確性以及確信度，這就是函數(shù)間隔

函數(shù)間隔可以表示分類預(yù)測的正確性以及確信度，但是選擇分離超平面時只有函數(shù)間隔是不夠的，因為只要成比例地改變w和b，超平面并沒有改變，但是函數(shù)間隔卻變?yōu)樵瓉淼膎倍。所以，我們需要對超平面的法向量w加上某些約束，如規(guī)范化，||w||=1，這樣使得間隔是確定的，這時函數(shù)為幾何間隔。