線性回歸背后的數(shù)學(xué)

本文是YouTube上視頻How to Do Linear Regression the Right Way筆記

假設(shè)我們有一堆數(shù)據(jù),并且他們是線性相關(guān)的,那我們?cè)趺凑页鲎詈线m的那條直線呢?

此處關(guān)鍵是定義什么是最合適?可以通過每個(gè)點(diǎn)到直線的距離來(lái)定義整個(gè)合適,如圖:

在上面的過程中,直線y=mx+b中m和b不管變化,從而找到最合適的直線,這個(gè)判斷的依據(jù)就是:

上面公式的含義是:假設(shè)點(diǎn)是(x,y),那相同x的直線上的點(diǎn)就是:(x,mx+b),而這兩者之間的距離就是(y-(mx+b)),為了防止出現(xiàn)負(fù)數(shù),因此我們就計(jì)算了平方,有了這個(gè)衡量的標(biāo)準(zhǔn)后,我們就可以畫出上面公式的一個(gè)圖了:

此處畫出來(lái)是一個(gè)立體圖,我們要找的一個(gè)最佳的直線,對(duì)應(yīng)到圖中其實(shí)就是一個(gè)最低點(diǎn),更形象的例子是:

如果我們此時(shí)放一個(gè)彈珠到碗里,最終彈珠停下來(lái)的點(diǎn)就是我們要找的最佳點(diǎn),現(xiàn)在我們沒有彈珠,我們要怎么找到這個(gè)最佳點(diǎn)呢?這就要講到偏導(dǎo)數(shù)(partial derivatives)的概念了,以前大學(xué)里學(xué)偏導(dǎo)數(shù)的是時(shí)候一直不明白為什么叫偏導(dǎo),直到最近看到英文:partial derivatives才明白,我們來(lái)看圖:

圖中的函數(shù)f是一個(gè)表面,如果我們固定住y,則是一個(gè)曲線,如圖中綠色的線,此時(shí)我們?cè)谟?jì)算點(diǎn)(a,b,f(a,b))在綠色線上的斜率,就可以得到沿著x方向的斜率了,同樣的我們固定x,就可以得到y(tǒng)方向的斜率,這樣子解釋,英文partial derivatives就很形象了,即計(jì)算的部分的斜率,合在一起才是曲面上這個(gè)點(diǎn)相切的一個(gè)平面。

由此我們就有了偏導(dǎo)數(shù):

根據(jù)上面的這些我們就有了最后的代碼:https://github.com/llSourcell/linear_regression_live

一些視頻的中的詞匯記錄:

back of your hand:了如指掌

gradient descent:梯度下降

partial derivatives:偏導(dǎo)數(shù)

calculus:微積分

correlation:相關(guān)性

intercept:截?cái)?/p>

slope:斜率

Convergence:收斂

slope formula:斜率公式

magnitude:大小

with respect to:關(guān)于

tangent:切線

好書推薦:Machine Learning and Probabilistic Approach

推薦資源

More learning resources:
http://mathinsight.org/image/partial_...
http://www.dummies.com/education/math...
https://spin.atomicobject.com/2014/06...
https://www.quora.com/What-is-an-intu...
http://machinelearningmastery.com/gra...

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 作者按:簡(jiǎn)書的文藝氣息還是比較濃的。我們來(lái)?yè)v搗亂,搞一篇全部數(shù)學(xué)公式的文章,用實(shí)際行動(dòng)推動(dòng)簡(jiǎn)書加入 MathJax...
    kamidox閱讀 1,467評(píng)論 8 6
  • 文章作者:Tyan博客:noahsnail.com | CSDN | 簡(jiǎn)書 聲明:作者翻譯論文僅為學(xué)習(xí),如有侵權(quán)請(qǐng)...
    SnailTyan閱讀 5,487評(píng)論 0 8
  • PID控制器是一種常用的控制技術(shù),常用于多種機(jī)械裝置(如車輛、機(jī)器人、火箭)中。用數(shù)學(xué)方式來(lái)描述PID控制器是非常...
    云淡天空閱讀 6,711評(píng)論 0 11
  • 摘要 一元線性回歸可以說(shuō)是數(shù)據(jù)分析中非常簡(jiǎn)單的一個(gè)知識(shí)點(diǎn),有一點(diǎn)點(diǎn)統(tǒng)計(jì)、分析、建模經(jīng)驗(yàn)的人都知道這個(gè)分析的含義,也...
    程sir閱讀 42,992評(píng)論 7 76
  • 1. 區(qū)分重載方法 規(guī)則很簡(jiǎn)單,每個(gè)重載的方法都必須有一個(gè)獨(dú)一無(wú)二的參數(shù)類型列表。以返回值來(lái)區(qū)分重載方法是行不通的...
    Megamind_China閱讀 381評(píng)論 0 0

友情鏈接更多精彩內(nèi)容