Q1:如何將兩組數(shù)據(jù)分開? 紅的和藍(lán)的

A1:嘗試畫了好多線都可以把他們分開,只要把握好關(guān)鍵的幾個球球,畫幾個切線就是分隔線的區(qū)域。橙色部分可以畫無數(shù)條線。

Q2:這么多條線,有沒有一條最靠譜?
A2:其實就這么多點,只要完成了分類都很靠譜。但是。如果。假設(shè)。若非。。還有其他的點。有一條線,它能接著正確劃分的概率比較大。只是概率比較大。

這是一個影響力的角逐,紅隊和藍(lán)隊,每一個球都會給這個棍棒一個遠(yuǎn)離他們的垂直作用力。你推我讓中,雙方的力量達(dá)到一個平衡,引出特征空間上間隔最大的線性分類器。SVM(support vector machine).
Q3:有些點就比較坑爹了,你怎么拿直線分?

A3:直線分不了用曲線。借用大神的解釋。好比一拍桌子,紅球和籃球都彈到了空中,不管多少維,總有一個N可以將他們分開,比如下圖的三維空間,可以用二維的平面把他們分開。而這個二維的平面就是在桌子上的投影就是那個曲線。

引出幾個概念
1.hyperplane 超平面,就是三維立體中的二維平面,也就是分類的決策邊界。分布在超平面的一側(cè)的所有數(shù)據(jù)都屬于某個類別,而分布在超平面的另一側(cè)的所有數(shù)據(jù)則屬于另一個類別。
2.margin,球球到分隔面的距離稱為間隔。我們希望間隔盡可能的大,這是因為我們犯錯或者在有限數(shù)據(jù)上訓(xùn)練分類器的話,我們希望分類器盡可能健壯。
3.support vector. 支持向量,就是離分隔面最近的那些點,這些球球相比距分隔面較遠(yuǎn)的點,更加決定分隔面的角度。接下來,試著最大化支持向量到分隔面的距離,需要找到此問題的優(yōu)化求解方法。