模型函數(shù)
模型是機器從數(shù)據(jù)中總結(jié)(學(xué)習(xí))出來的一個規(guī)律,可以用這個規(guī)律進行預(yù)測和判斷。
模型函數(shù)是這個規(guī)律的具體數(shù)學(xué)表示。
如:我們要從下圖中找出經(jīng)驗(Experience)和工資(Salary)之間的關(guān)系,或者說找到一個用于計算工資的模型。

把 Experience 與 Salary 抽取出來,用 x 和 y 來分別指代它們。

通過在二維坐標系里通過畫圖來看一下 x 與 y 的關(guān)系:

從圖中可以看出 x與y的關(guān)系大致是一條直線。那么就可以假設(shè)這個函數(shù)為:
y=ax+b 這個函數(shù)就是模型函數(shù)?,F(xiàn)在只要求出函數(shù)中的a和b就行了。
由x=0的時候y=103100可求出b=103100再由x=1時候y=104900可求出a=1800
這樣模型函數(shù)可表示為:y=1800x+103100
用這個函數(shù)去計算一下x=2時候y=106700 與圖中的106800有一點差別,x為其他值得時候也都有一點差別,這個a和b只是一個近似值。因為只要上圖6組數(shù)據(jù)之中任意兩組都可以算出一組不同的a b,用哪一組都不一定是最好的。都是會產(chǎn)生差異的。
目標函數(shù)
既然都會產(chǎn)生差異哪我們想辦法求出使這個差異達到最小時候的ab不就是最合適的么。
這個時候就需要像個辦法表示一下這個差異。用表示單個樣本的預(yù)測值與實際值的差異。
用個體差異之和除以2m(m為個體數(shù)量)表示整體差異。
用公式表示為:

這個函數(shù)被叫做代價函數(shù),也是我們的目標函數(shù)。其中ab看做自變量,x和y都是樣本數(shù)據(jù)。那么求整體差異最小不就是求這個函數(shù)的最小值么。代價函數(shù)值最小的時候的ab就是最合適的模型函數(shù)參數(shù)。