機器學習入門——cost function

跟隨吳恩達的coursear課程學習。
入門第一課是理解最簡單的線性回歸問題。

先上問題:通過房子的大?。╨iving area -> x)來預測房價(house price -> y)。
同時,給予m個案例,這里的m就是樣本(training set)個數。

QQ20180228-211719@2x.png

為了生動形象,這里的行數就是樣本數(m)
左邊一列是房子大?。▁)
右邊一列是對應的價格(y)

現(xiàn)在我們可以得出一個假設函數(hypothesis function):
hθ(xi) = θ0 + θ1*x,該函數就是假設的面積對應的房價。
hθ(xi) 代表了房價,x就是房子面積。

現(xiàn)在需要求出θ0和θ1的值來求出房價,而hθ(xi) 的值需要接近樣本的房價,我們可以用 hθ(xi) 和 樣本中的房價做比較,用最小二乘法來計算。
可以得出(cost function):


20170224091950219.png

現(xiàn)在我們考慮單變量的情況,即θ0=0,這樣可以更簡單的理解J(θ0,θ1)函數。
hθ(xi) = θ1*x

下圖就可以更加直觀的理解cost function的推導。

R2YF5Lj3EeajLxLfjQiSjg_110c901f58043f995a35b31431935290_Screen-Shot-2016-12-02-at-5.23.31-PM.png

坐標系中的藍線就是假設函數,現(xiàn)在計算假設的房價和樣本的房價的差距,就是(hθ(xi)-yi)^2,現(xiàn)在我們有m個樣本,即需要求和,再除以m是取平均,除以2暫時還沒理解,在以后發(fā)現(xiàn)用處后再來補充。

現(xiàn)在,我們畫出hθ(x)和J(θ0,θ1)的圖像

_B8TJZtREea33w76dwnDIg_3e3d4433e32478f8df446d0b6da26c27_Screenshot-2016-10-26-00.57.56.png

左圖是假設函數,右圖是代價函數
在最理想的狀態(tài)下,我們的假設函數剛好在樣本上,那么J(θ)的值計算得出=0
但是,我們不可能一開始就能從樣本數據直接得出θ1的值,所以,正常情況下我們會有這樣的函數,如下圖:

8guexptSEeanbxIMvDC87g_3d86874dfd37b8e3c53c9f6cfa94676c_Screenshot-2016-10-26-01.03.07.png

我們把θ1猜測成0.5,那么,現(xiàn)在需要計算J(θ1)的值為每個樣本距離函數的距離的平方/(2m)。
J(θ1)=(0.25+1+2.25)/(2
3)=0.583333333
那么在右圖就是對應的藍色叉叉的位置

現(xiàn)在,我們就同理,切換不同的θ1的值,計算出J(θ)的值
如圖:


J(θ).png

咦,可以看出是類似一個2次函數的圖像,從圖像上看,θ1=1時,是假設的房價最接近樣本的時候,那么現(xiàn)在,我們可以認為假設函數得出的值是最靠譜的。

雙變量情況
上面考慮的只是單變量情況,現(xiàn)在,我們來求出雙變量θ0,θ1的值


QQ20180301-110254@2x.png

因為是兩個變量,所以J(θ0,θ1)的函數不是一個平面圖可以表達的,他是一個三維圖

雙變量.png

我們現(xiàn)在把J函數“壓扁”,就得到一個θ0和θ1的圖像,上圖右邊的
在右圖隨機取一個點,看到左圖hθ(x)的值。

我們慢慢向圓心靠近


20170224092414003.png

函數與樣本的擬合慢慢開始接近
當θ0,θ1在圓心的時候


20170224092444275.png

假設函數和樣本值的擬合度最高??墒乾F(xiàn)在我們是用肉眼來尋找θ0,θ1的值,而且在實際問題上,可能無法畫出代價函數J(θ0,θ1),下一篇將尋找求出θ0,θ1的方法。
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容