第十章 線性回歸---從模型函數(shù)到目標函數(shù)

模型函數(shù)

模型是機器從數(shù)據(jù)中總結(jié)(學(xué)習(xí))出來的一個規(guī)律,可以用這個規(guī)律進行預(yù)測和判斷。

模型函數(shù)是這個規(guī)律的具體數(shù)學(xué)表示。

如:我們要從下圖中找出經(jīng)驗(Experience)和工資(Salary)之間的關(guān)系,或者說找到一個用于計算工資的模型。


858c7a60-30da-11e8-bd94-39c7911865f2.png

把 Experience 與 Salary 抽取出來,用 x 和 y 來分別指代它們。


da1bc9c0-30dd-11e8-881f-abba1a6c9fa2.png

通過在二維坐標系里通過畫圖來看一下 x 與 y 的關(guān)系:


3c607ef0-30de-11e8-b73c-178173ff19b5.png

從圖中可以看出 x與y的關(guān)系大致是一條直線。那么就可以假設(shè)這個函數(shù)為:
y=ax+b 這個函數(shù)就是模型函數(shù)?,F(xiàn)在只要求出函數(shù)中的a和b就行了。
由x=0的時候y=103100可求出b=103100再由x=1時候y=104900可求出a=1800
這樣模型函數(shù)可表示為:y=1800x+103100
用這個函數(shù)去計算一下x=2時候y=106700 與圖中的106800有一點差別,x為其他值得時候也都有一點差別,這個a和b只是一個近似值。因為只要上圖6組數(shù)據(jù)之中任意兩組都可以算出一組不同的a b,用哪一組都不一定是最好的。都是會產(chǎn)生差異的。

目標函數(shù)

既然都會產(chǎn)生差異哪我們想辦法求出使這個差異達到最小時候的ab不就是最合適的么。
這個時候就需要像個辦法表示一下這個差異。用(y`-y)^2表示單個樣本的預(yù)測值與實際值的差異。
用個體差異之和除以2m(m為個體數(shù)量)表示整體差異。
用公式表示為:

1551966298152.jpg

這個函數(shù)被叫做代價函數(shù),也是我們的目標函數(shù)。其中ab看做自變量,x和y都是樣本數(shù)據(jù)。那么求整體差異最小不就是求這個函數(shù)的最小值么。代價函數(shù)值最小的時候的ab就是最合適的模型函數(shù)參數(shù)。

線性函數(shù)在二維坐標系中表現(xiàn)為直線,在三維中表示平面,更高維度想想不到了。總之線性不但是直線的意思。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容