感知機(jī)(perceptron)是二分類的線性分類模型,輸入為實(shí)例的特征向量,輸出為實(shí)例的類別(取+1和-1)。
感知機(jī)對應(yīng)于輸入空間中將實(shí)例劃分為兩類的分離超平面。
感知機(jī)旨在求出該超平面,為求得超平面導(dǎo)入了基于誤分類的損失函數(shù),利用梯度下降法 對損失函數(shù)進(jìn)行最優(yōu)化(最優(yōu)化)。
感知機(jī)的學(xué)習(xí)算法具有簡單而易于實(shí)現(xiàn)的優(yōu)點(diǎn),分為原始形式和對偶形式。
感知機(jī)預(yù)測是用學(xué)習(xí)得到的感知機(jī)模型對新的實(shí)例進(jìn)行預(yù)測的,因此屬于判別模型。感知機(jī)由Rosenblatt于1957年提出的,是神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的基礎(chǔ)。
感知機(jī)模型
數(shù)學(xué)原理
用數(shù)學(xué)的語言來說,如果我們有m個(gè)樣本,如果我們有m個(gè)樣本,每個(gè)樣本對應(yīng)于n維特征和一個(gè)二元類別輸出,如下:
目標(biāo)是找到一個(gè)超平面,即
目標(biāo)是讓
某一類樣本
另一類樣本滿足
從而得到線性可分。如果數(shù)據(jù)線性可分,這樣的超平面一般都不是唯一的,也就是說感知機(jī)模型可以有多個(gè)解。
幾何解釋
感知機(jī)模型是線性分類模型,感知機(jī)模型的假設(shè)空間是定義在特征空間中的所有線性分類模型,即函數(shù)集合{f|f(x)=w·x+b}。
線性方程 對應(yīng)于特征空間
中的一個(gè)超平面
,其中
是超平面的法向量,b是超平面的截踞。這個(gè)超平面把特征空間劃分為兩部分。位于兩側(cè)的點(diǎn)分別為正負(fù)兩類。超平面S稱為分離超平面,如下圖:
