問題定義
給定數(shù)據(jù)集,
是一個(gè)向量,
是一個(gè)標(biāo)量。數(shù)據(jù)集中的每個(gè)數(shù)據(jù)對(duì)
可以看做空間中的一個(gè)點(diǎn),那么線性回歸問題就是試圖學(xué)得一個(gè)超平面,使得數(shù)據(jù)集中的點(diǎn)盡量落在或者靠近這個(gè)超平面。
衡量與
之前的差別,可以采用均方誤差這種性能度量。數(shù)據(jù)集D中的每個(gè)樣本的誤差為
,均方誤差就是所有樣本的誤差的加和平均,即
問題求解
在該問題中,我們要求解的變量是和
,使得
和
取得最優(yōu)值的時(shí)候,誤差
取得最小值。即如下優(yōu)化問題:
求最大最小值的問題,可以對(duì)和
求關(guān)于損失函數(shù)
的偏導(dǎo)數(shù),然后令導(dǎo)數(shù)為0,得到一組等式,聯(lián)立求解方程即可。