關(guān)于機器學(xué)習(xí)SVM算法介紹

【嵌牛導(dǎo)讀】:對于普通的線性可分問題,通常我們可以找到一條直線將數(shù)據(jù)分為兩類,但是一般情況下我們找到的分類線不止一條,如何選擇最優(yōu)分類線是面臨的問題。

【嵌牛鼻子】:SVM,線性可分,最優(yōu)分類線選擇

【嵌牛提問】:SVM算法用來解決什么問題?什么時候采用SVM算法?

【嵌牛正文】:

首先給出一個非常非常簡單的分類問題(線性可分),我們要用一條直線,將圖一中黑色的點和白色的點分開,很顯然,圖一的這條直線就是我們要求的直線之一,但是從圖二可以看出將這些點分開的線不止有一條,那么選擇哪一條就是面臨的問題。

圖一

圖二

我們從圖三,圖四選擇了兩種不同的分法,如下:

圖三

圖四

我們可以觀察到,圖四上的直線相對于圖一樣本中的點距離遠,在實踐中分類效果也是優(yōu)于圖四,我們把圖四上圈出來的點稱為支持向量即support vector,而圖四的黃色部分我們稱為margine,我們的目的也就是要讓這段間隔最大化。如圖五所示,M的計算公式為



我們要最大化M即另W的二范數(shù)最小,為了方便求導(dǎo)我們將其先平方在其系數(shù)加上1/2,

但是當(dāng)樣本點出現(xiàn)在間隔中我們無法判定屬于哪一類,因此為了確保樣本點不在間隔內(nèi),我么那加入了約束條件

s.t的意思是subject to,也就是在后面這個限制條件下的意思,W為列向量。我們要求下面函數(shù)的最優(yōu)解。轉(zhuǎn)化為對偶問題。

利用拉格朗日乘子方法,求得最優(yōu)解α*,然后繼續(xù)求得w*,b*,即得到了分類的超平面w*x+b*=0;我們將決策函數(shù)寫為f(x)=sign(w*x+b*)。至此我們便找到了分類面,這也就是svm算法的硬間隔問題。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容