本文是YouTube上視頻How to Do Linear Regression the Right Way筆記
假設(shè)我們有一堆數(shù)據(jù),并且他們是線性相關(guān)的,那我們?cè)趺凑页鲎詈线m的那條直線呢?
此處關(guān)鍵是定義什么是最合適?可以通過每個(gè)點(diǎn)到直線的距離來(lái)定義整個(gè)合適,如圖:
在上面的過程中,直線y=mx+b中m和b不管變化,從而找到最合適的直線,這個(gè)判斷的依據(jù)就是:
上面公式的含義是:假設(shè)點(diǎn)是(x,y),那相同x的直線上的點(diǎn)就是:(x,mx+b),而這兩者之間的距離就是(y-(mx+b)),為了防止出現(xiàn)負(fù)數(shù),因此我們就計(jì)算了平方,有了這個(gè)衡量的標(biāo)準(zhǔn)后,我們就可以畫出上面公式的一個(gè)圖了:
此處畫出來(lái)是一個(gè)立體圖,我們要找的一個(gè)最佳的直線,對(duì)應(yīng)到圖中其實(shí)就是一個(gè)最低點(diǎn),更形象的例子是:

如果我們此時(shí)放一個(gè)彈珠到碗里,最終彈珠停下來(lái)的點(diǎn)就是我們要找的最佳點(diǎn),現(xiàn)在我們沒有彈珠,我們要怎么找到這個(gè)最佳點(diǎn)呢?這就要講到偏導(dǎo)數(shù)(partial derivatives)的概念了,以前大學(xué)里學(xué)偏導(dǎo)數(shù)的是時(shí)候一直不明白為什么叫偏導(dǎo),直到最近看到英文:partial derivatives才明白,我們來(lái)看圖:

圖中的函數(shù)f是一個(gè)表面,如果我們固定住y,則是一個(gè)曲線,如圖中綠色的線,此時(shí)我們?cè)谟?jì)算點(diǎn)(a,b,f(a,b))在綠色線上的斜率,就可以得到沿著x方向的斜率了,同樣的我們固定x,就可以得到y(tǒng)方向的斜率,這樣子解釋,英文partial derivatives就很形象了,即計(jì)算的部分的斜率,合在一起才是曲面上這個(gè)點(diǎn)相切的一個(gè)平面。
由此我們就有了偏導(dǎo)數(shù):
根據(jù)上面的這些我們就有了最后的代碼:https://github.com/llSourcell/linear_regression_live
一些視頻的中的詞匯記錄:
back of your hand:了如指掌
gradient descent:梯度下降
partial derivatives:偏導(dǎo)數(shù)
calculus:微積分
correlation:相關(guān)性
intercept:截?cái)?/p>
slope:斜率
Convergence:收斂
slope formula:斜率公式
magnitude:大小
with respect to:關(guān)于
tangent:切線
好書推薦:Machine Learning and Probabilistic Approach
推薦資源
More learning resources:
http://mathinsight.org/image/partial_...
http://www.dummies.com/education/math...
https://spin.atomicobject.com/2014/06...
https://www.quora.com/What-is-an-intu...
http://machinelearningmastery.com/gra...