Topic: cost Function
在Regression中,我們需要去擬合(fit)數(shù)據(jù)和我們的模型函數(shù)。
這樣函數(shù)和數(shù)據(jù)集中的一些training data就會(huì)不擬合,在幾何意義上有距離。
Cost Function就是為了量化的表示函數(shù)參數(shù)與數(shù)據(jù)集的契合程度而出現(xiàn)的。

舉個(gè)例子,對(duì)于LR而言,我們要做的是選擇合適的theta0和theta1,來讓我們的線性函數(shù)擬合這個(gè)數(shù)據(jù)集。

由于這是一個(gè)很簡單的例子,是二維的,因變量只有一個(gè)(polynomial)。
所以我們很容易根據(jù)中小學(xué)的知識(shí)得到幾何距離公式

其中是hypothesis function,也就是我們所預(yù)測(cè)的Regression,而
是具體某個(gè)training data的預(yù)測(cè)值
我們尋找最好參數(shù)的任務(wù)就變成了:

在最簡化的情況下,我們連theta0都沒有,只有一個(gè)theta1.
即hypothesis function穿過數(shù)軸原點(diǎn)。??

在本節(jié)視頻中,我們?cè)賮黻P(guān)注Cost Function

這是J函數(shù)的等高線圖

雖然我們可以通過等高線圖來得出結(jié)論,但我們真正需要的是一個(gè)可以高效的幫助我們找到適合參數(shù)的算法,而不是去想辦法畫等高線圖,這個(gè)圖只是為了幫助我們理解Cost Function J隨參數(shù)的變化。
好的算法見下一章,Gradient Descent.