來自于Simple Learning Pro的系列
相關性
為了描述兩個變量之間的相關關系,我們一般可以采用散點圖用于描述。
這兩個變量,我們把其中一個稱為解釋變量,也是自變量;一般放于X軸;另一個稱為自變量,一般放于Y軸
描述相關性(r)時有兩個要素:
相關性的方向:正相關 or 負相關
相關性的強弱:越接近于1/-1表示相關性越強

相關性
回歸方程和R-squared
為了對兩個變量之間的相關關系做更好的描述,我們可以引入回歸方程;
Y=b0+b1*X;其中b0為截距,b1為相關系數
同時我們引入R-squared(上文中r的平方)來反映回歸方程整體的擬合度,表達因變量與所有自變量之間的總體關系。R2等于回歸平方和在總平方和中所占的比率,即回歸方程所能解釋的因變量變異性的百分比。

回歸方程
殘差
殘差:觀測值與擬合值的偏離,殘差大小可以衡量預測的準確性;
在回歸中也要注意異常值點
