機(jī)器學(xué)習(xí)-線性回歸模型

問題定義

給定數(shù)據(jù)集D=\{(\boldsymbol{x}_1, y_1),(\boldsymbol{x}_2, y_2),\cdots,(\boldsymbol{x}_m, y_m) \}\boldsymbol{x}_i=(x_{i1};x_{i2};\cdots;x_{id})是一個(gè)向量,y_i\in\mathbb{R}是一個(gè)標(biāo)量。數(shù)據(jù)集中的每個(gè)數(shù)據(jù)對(duì)(\boldsymbol{x}_i, y_i)可以看做空間中的一個(gè)點(diǎn),那么線性回歸問題就是試圖學(xué)得一個(gè)超平面,使得數(shù)據(jù)集中的點(diǎn)盡量落在或者靠近這個(gè)超平面。f(\boldsymbol{x}_i) = \boldsymbol{wx}_i+b, \quad s.t. \quad f(\boldsymbol{x}_i)\simeq y_i
衡量f(\boldsymbol{x}_i)y_i之前的差別,可以采用均方誤差這種性能度量。數(shù)據(jù)集D中的每個(gè)樣本的誤差為e_i=(f(\boldsymbol{x}_i) - y_i )^2,均方誤差就是所有樣本的誤差的加和平均,即E(f;D) = \frac{1}{m} \sum_{i=1}^m\limits(f(\boldsymbol{x}_i) - y_i )^2

問題求解

在該問題中,我們要求解的變量是\boldsymbol{w}b,使得\boldsymbol{w}b取得最優(yōu)值的時(shí)候,誤差E(f;D)取得最小值。即如下優(yōu)化問題:
\begin{aligned}(\boldsymbol{w}^*,b^*)=\mathop{\arg\min}_{(\boldsymbol{w},b)}\sum_{i=1}^m(f(x_i) - y_i)^2 \\ =\mathop{\arg\min}_{(\boldsymbol{w},b)}\sum_{i=1}^m(y_i - wx_i-b)^2 \end{aligned}
求最大最小值的問題,可以對(duì)wb求關(guān)于損失函數(shù)E的偏導(dǎo)數(shù),然后令導(dǎo)數(shù)為0,得到一組等式,聯(lián)立求解方程即可。
\begin{align} \frac{\partial E_{(w,b)}}{\partial w}&=2\biggl(w\sum_{i=1}^mx_i^2 - \sum_{i=1}^m(y_i-b)x_i\biggr)=0, \\ \frac{\partial E_{(w,b)}}{\partial w}&=2\biggl(mb - \sum_{i=1}^m(y_i - wx_i)\biggr)=0, \end{align}

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容