正式稿:
每天1分鐘數(shù)據(jù)分析小知識1-回歸分析
我們現(xiàn)實(shí)中遇到的數(shù)據(jù),一般都是“毫無規(guī)律”的散點(diǎn)圖,回歸分析就是把這張散點(diǎn)圖,假設(shè)成有兩個(gè)或多個(gè)變量,通過一些系數(shù)、常數(shù)或者指數(shù)化過程組合起來,求出它們之間的函數(shù)表達(dá),去探索出這張散點(diǎn)圖的“規(guī)律”,以還原出這兩個(gè)或多個(gè)變量之間的依賴關(guān)系,這個(gè)過程就叫做回歸分析。
比如在EXCEL中,求一張散點(diǎn)圖的回歸方程的方法就是,作出這張散點(diǎn)圖的趨勢線,然后選中這條趨勢線在“設(shè)置趨勢線格式”中勾選最下面兩行“顯示公式”和“顯示R平方值”,我們就可以看到這張散點(diǎn)圖的回歸方程y=ax+c和擬合度R2。



這個(gè)是實(shí)際工作中最快捷求出回歸方程和擬合度(即回歸方程可信程度)的方法。
資料收集:
百度詞條:在統(tǒng)計(jì)學(xué)中,回歸分析(regression analysis)指的是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法?;貧w分析按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。
INTERCEPT 函數(shù)
說明
利用已知的 x 值與 y 值計(jì)算直線與 y 軸交叉點(diǎn)。 交叉點(diǎn)是以通過已知 x 值和已知 y 值繪制的最佳擬合回歸線為基礎(chǔ)的。 當(dāng)自變量是 0(零)時(shí),可使用 INTERCEPT 函數(shù)確定因變量的值。 例如,當(dāng)您在室溫或更高溫度的情況下采集數(shù)據(jù)點(diǎn)時(shí),您可以使用 INTERCEPT 函數(shù)預(yù)測金屬在 0°C 時(shí)的電阻。
語法
INTERCEPT(known_y's, known_x's)
INTERCEPT 函數(shù)語法具有下列參數(shù):
Known_y's必需。 因變的觀察值或數(shù)據(jù)的集合。
Known_x's必需。 自變的觀察值或數(shù)據(jù)的集合。
備注
參數(shù)可以是數(shù)字,或者是包含數(shù)字的名稱、數(shù)組或引用。
如果數(shù)組或引用參數(shù)包含文本、邏輯值或空白單元格,則這些值將被忽略;但包含零值的單元格將計(jì)算在內(nèi)。
如果 known_y's 和 known_x's 所包含的數(shù)據(jù)點(diǎn)個(gè)數(shù)不相等或不包含任何數(shù)據(jù)點(diǎn),則函數(shù) INTERCEPT 返回錯(cuò)誤值 #N/A。
回歸線 a 的截距公式為:

公式中斜率 b 計(jì)算如下:

其中 x 和 y 是樣本平均值 AVERAGE(known_x's) 和 AVERAGE(known_y's)。
INTERCEPT 和 SLOPE 函數(shù)中使用的下層算法與 LINEST 函數(shù)中使用的下層算法不同。 當(dāng)數(shù)據(jù)未定且共線時(shí),這些算法之間的差異會導(dǎo)致不同的結(jié)果。 例如,如果參數(shù) known_y's 的數(shù)據(jù)點(diǎn)為 0,參數(shù) known_x's 的數(shù)據(jù)點(diǎn)為 1:
截距和斜率返回 #DIV/0! 錯(cuò)誤。 截距和斜度算法旨在查找一個(gè)且僅一個(gè)答案,在這種情況下,可以有多個(gè)答案。
LINEST 會返回值 0。 LINEST 的算法用來返回共線數(shù)據(jù)的合理結(jié)果,在這種情況下至少可找到一個(gè)答案。
示例
復(fù)制下表中的示例數(shù)據(jù),然后將其粘貼進(jìn)新的 Excel 工作表的 A1 單元格中。 要使公式顯示結(jié)果,請選中它們,按 F2,然后按 Enter。 如果需要,可調(diào)整列寬以查看所有數(shù)據(jù)。
已知 y已知 x
26
35
911
17
85
公式說明結(jié)果
=INTERCEPT(A2:A6, B2:B6)利用上面已知的 x 值與 y 值計(jì)算直線與 y 軸的截距0.0483871