支持向量機(jī)(SVM)

Q1:如何將兩組數(shù)據(jù)分開? 紅的和藍(lán)的

Paste_Image.png

A1:嘗試畫了好多線都可以把他們分開,只要把握好關(guān)鍵的幾個球球,畫幾個切線就是分隔線的區(qū)域。橙色部分可以畫無數(shù)條線。

Paste_Image.png

Q2:這么多條線,有沒有一條最靠譜?
A2:其實就這么多點,只要完成了分類都很靠譜。但是。如果。假設(shè)。若非。。還有其他的點。有一條線,它能接著正確劃分的概率比較大。只是概率比較大。

Paste_Image.png

這是一個影響力的角逐,紅隊和藍(lán)隊,每一個球都會給這個棍棒一個遠(yuǎn)離他們的垂直作用力。你推我讓中,雙方的力量達(dá)到一個平衡,引出特征空間上間隔最大的線性分類器。SVM(support vector machine).

Q3:有些點就比較坑爹了,你怎么拿直線分?


Paste_Image.png

A3:直線分不了用曲線。借用大神的解釋。好比一拍桌子,紅球和籃球都彈到了空中,不管多少維,總有一個N可以將他們分開,比如下圖的三維空間,可以用二維的平面把他們分開。而這個二維的平面就是在桌子上的投影就是那個曲線。

Paste_Image.png

圖片來源:https://www.reddit.com/r/MachineLearning/comments/15zrpp/please_explain_support_vector_machines_svm_like_i/

引出幾個概念
1.hyperplane 超平面,就是三維立體中的二維平面,也就是分類的決策邊界。分布在超平面的一側(cè)的所有數(shù)據(jù)都屬于某個類別,而分布在超平面的另一側(cè)的所有數(shù)據(jù)則屬于另一個類別。

2.margin,球球到分隔面的距離稱為間隔。我們希望間隔盡可能的大,這是因為我們犯錯或者在有限數(shù)據(jù)上訓(xùn)練分類器的話,我們希望分類器盡可能健壯。

3.support vector. 支持向量,就是離分隔面最近的那些點,這些球球相比距分隔面較遠(yuǎn)的點,更加決定分隔面的角度。接下來,試著最大化支持向量到分隔面的距離,需要找到此問題的優(yōu)化求解方法。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容