跟隨吳恩達的coursear課程學習。
入門第一課是理解最簡單的線性回歸問題。
先上問題:通過房子的大?。╨iving area -> x)來預測房價(house price -> y)。
同時,給予m個案例,這里的m就是樣本(training set)個數。

為了生動形象,這里的行數就是樣本數(m)
左邊一列是房子大?。▁)
右邊一列是對應的價格(y)
現(xiàn)在我們可以得出一個假設函數(hypothesis function):
hθ(xi) = θ0 + θ1*x,該函數就是假設的面積對應的房價。
hθ(xi) 代表了房價,x就是房子面積。
現(xiàn)在需要求出θ0和θ1的值來求出房價,而hθ(xi) 的值需要接近樣本的房價,我們可以用 hθ(xi) 和 樣本中的房價做比較,用最小二乘法來計算。
可以得出(cost function):

現(xiàn)在我們考慮單變量的情況,即θ0=0,這樣可以更簡單的理解J(θ0,θ1)函數。
hθ(xi) = θ1*x
下圖就可以更加直觀的理解cost function的推導。

坐標系中的藍線就是假設函數,現(xiàn)在計算假設的房價和樣本的房價的差距,就是(hθ(xi)-yi)^2,現(xiàn)在我們有m個樣本,即需要求和,再除以m是取平均,除以2暫時還沒理解,在以后發(fā)現(xiàn)用處后再來補充。
現(xiàn)在,我們畫出hθ(x)和J(θ0,θ1)的圖像

左圖是假設函數,右圖是代價函數
在最理想的狀態(tài)下,我們的假設函數剛好在樣本上,那么J(θ)的值計算得出=0
但是,我們不可能一開始就能從樣本數據直接得出θ1的值,所以,正常情況下我們會有這樣的函數,如下圖:

我們把θ1猜測成0.5,那么,現(xiàn)在需要計算J(θ1)的值為每個樣本距離函數的距離的平方/(2m)。
J(θ1)=(0.25+1+2.25)/(23)=0.583333333
那么在右圖就是對應的藍色叉叉的位置
現(xiàn)在,我們就同理,切換不同的θ1的值,計算出J(θ)的值
如圖:

咦,可以看出是類似一個2次函數的圖像,從圖像上看,θ1=1時,是假設的房價最接近樣本的時候,那么現(xiàn)在,我們可以認為假設函數得出的值是最靠譜的。
雙變量情況
上面考慮的只是單變量情況,現(xiàn)在,我們來求出雙變量θ0,θ1的值

因為是兩個變量,所以J(θ0,θ1)的函數不是一個平面圖可以表達的,他是一個三維圖

我們現(xiàn)在把J函數“壓扁”,就得到一個θ0和θ1的圖像,上圖右邊的
在右圖隨機取一個點,看到左圖hθ(x)的值。
我們慢慢向圓心靠近

函數與樣本的擬合慢慢開始接近
當θ0,θ1在圓心的時候

假設函數和樣本值的擬合度最高??墒乾F(xiàn)在我們是用肉眼來尋找θ0,θ1的值,而且在實際問題上,可能無法畫出代價函數J(θ0,θ1),下一篇將尋找求出θ0,θ1的方法。