
Road Map
機器學習算法A會看資料D和假設集合H,然后在H里面選一個g?,F(xiàn)在我們來看機器是如何處理是非題。(二分類)
What hypothesis can we use?
那么我們的來看一個模型,看看這個H長什么樣。

用戶的申請表
x = (x1,x2,...,xd),這些是features of customer, 乘上一個權(quán)重w,來計算score。

判定規(guī)則
y:{+1(good),-1(bad)}。
通過將右邊的threshold移到左邊就可以知道,如果左邊項 > 0,那么 y=1;如果左邊項 < 0,那么y=-1。這也可以用sign函數(shù)來表示。(這里如果左邊項 = 0,其實這個不重要,y可以隨便等于1或者-1)

Perceptron
上面的這個公式叫做感知機Perceptron,h與w和threshold有關,不同的w與threshold取值就可以確定不同的h。(w是一個矩陣)
下面進行一個符號上的簡化。

簡化步驟
具體來看一下h。

二維空間里的感知器
x:在平面上的點(這個點在d維空間里)
y:O(+1),X(-1)
h:lines(或者是在d維空間里的超平面)
h的一邊是預測成+1,另一邊是預測成-1。
(問題:這里的h是H嗎?這里的d維空間或者d+1維空間需要分得很清楚嗎,因為前面剛才提到過x0和w0)
習題:

習題
答案是2。+1代表的spam。如果想要很大的權(quán)重,說明這些單詞在spam里面經(jīng)常出現(xiàn)的。