感知機(jī)

感知機(jī)(perceptron)是二分類的線性分類模型,輸入為實(shí)例的特征向量,輸出為實(shí)例的類別(取+1和-1)。

感知機(jī)對應(yīng)于輸入空間中將實(shí)例劃分為兩類的分離超平面。

感知機(jī)旨在求出該超平面,為求得超平面導(dǎo)入了基于誤分類的損失函數(shù),利用梯度下降法 對損失函數(shù)進(jìn)行最優(yōu)化(最優(yōu)化)。

感知機(jī)的學(xué)習(xí)算法具有簡單而易于實(shí)現(xiàn)的優(yōu)點(diǎn),分為原始形式和對偶形式。

感知機(jī)預(yù)測是用學(xué)習(xí)得到的感知機(jī)模型對新的實(shí)例進(jìn)行預(yù)測的,因此屬于判別模型。感知機(jī)由Rosenblatt于1957年提出的,是神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的基礎(chǔ)。

感知機(jī)模型

數(shù)學(xué)原理

用數(shù)學(xué)的語言來說,如果我們有m個(gè)樣本,如果我們有m個(gè)樣本,每個(gè)樣本對應(yīng)于n維特征和一個(gè)二元類別輸出,如下:

(x_1^{(0)}, x_2^{(0)}, ...x_n^{(0)}, y_0), (x_1^{(1)}, x_2^{(1)}, ...x_n^{(1)},y_1), ... (x_1^{(m)}, x_2^{(m)}, ...x_n^{(m)}, y_m)

目標(biāo)是找到一個(gè)超平面,即

\theta_0 + \theta_{1}x_1 + ... + \theta_{n}x_{n} = 0

目標(biāo)是讓
某一類樣本
\theta_0 + \theta_{1}x_1 + ... + \theta_{n}x_{n} > 0
另一類樣本滿足
\theta_0 + \theta_{1}x_1 + ... + \theta_{n}x_{n} < 0
從而得到線性可分。如果數(shù)據(jù)線性可分,這樣的超平面一般都不是唯一的,也就是說感知機(jī)模型可以有多個(gè)解。

幾何解釋

感知機(jī)模型是線性分類模型,感知機(jī)模型的假設(shè)空間是定義在特征空間中的所有線性分類模型,即函數(shù)集合{f|f(x)=w·x+b}。

線性方程 wx+b=0 對應(yīng)于特征空間R^n中的一個(gè)超平面S,其中w是超平面的法向量,b是超平面的截踞。這個(gè)超平面把特征空間劃分為兩部分。位于兩側(cè)的點(diǎn)分別為正負(fù)兩類。超平面S稱為分離超平面,如下圖:

image

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容