機(jī)器學(xué)習(xí)(一)線性回歸

機(jī)器學(xué)習(xí)的兩個(gè)重要的問題,一個(gè)是回歸,一個(gè)是分類。
回歸問題指的是對一組數(shù)據(jù)進(jìn)行擬合,比如房價(jià)問題,f(x)=y,x是房子的面積,y就是最終的房價(jià),在這個(gè)問題中,我們最終通過一個(gè)模型來得到擬合的結(jié)果。這樣就可以在知道房子面積的時(shí)候,通過訓(xùn)練模型得到房子的價(jià)格。
衡量這些數(shù)據(jù)的模型,最簡單的就是線性模型。在線性模型中,有一個(gè)重要的問題,就是如何去評價(jià)模型的好壞,比如我們得到了擬合的曲線,知道了在某一個(gè)數(shù)據(jù)點(diǎn)的預(yù)測值,那么它和真實(shí)值之間的差距到底有多少呢?

損失函數(shù)

這是機(jī)器學(xué)習(xí)最重要的一個(gè)步驟,定義損失函數(shù),然后使用優(yōu)化方式去最小化損失函數(shù),在線性回歸中,影響最終結(jié)果的特征值可能有很多個(gè),比如在下面的方程中,可以把x1看作是房屋面積,x2看作是房屋的地段,通過這樣一個(gè)線性回歸方程就可以計(jì)算最終的房屋價(jià)格。


image

使用通用的模型定義:


image

這里就要介紹最重要的損失函數(shù),通過計(jì)算預(yù)測房價(jià)和真實(shí)房價(jià)之間的差距,就可以評估整個(gè)線性模型的好壞,平方項(xiàng)和系數(shù)1/2,這樣定義的原因是為了方便后續(xù)的求導(dǎo)操作。問題最終就是通過尋找合適的theta值來找到最小的損失值,那么下面就介紹求解的方法。
image

求解方法

最小二乘法和梯度下降法

最小二乘法

首先對目標(biāo)函數(shù)進(jìn)行轉(zhuǎn)換,使用矩陣方程表示:


image

目標(biāo)取得最小值的點(diǎn),可以通過求導(dǎo)操作找到:


image

最終的結(jié)果如下所示:
image

此方法要求矩陣為列滿秩,求矩陣的逆運(yùn)算計(jì)算量還是比較大的,如果特征維數(shù)較高,使用這種方式就會(huì)嚴(yán)重影響計(jì)算速度,下面就介紹另外一種方法。

梯度下降法

初始化theta:


image

對損失函數(shù)求導(dǎo):


image

image

參考鏈接
[https://www.cnblogs.com/futurehau/p/6105011.html]

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容