相關(guān)分析,是表明因素之間相關(guān)程度的絕佳方法,比如被人津津樂道的 超市里啤酒和尿不濕的相關(guān)分析。
超市工作人員發(fā)現(xiàn): 啤酒的銷量和尿不濕的銷量 成正比,也就是正相關(guān)關(guān)系。所以 就把兩類商品放在一起買,銷量嗷嗷嗷地放上升。
細(xì)細(xì)琢磨下,可以探求一二。買尿不濕的多是在家?guī)雰旱哪惺?,而啤酒是他們打發(fā)無聊時間的最佳伴侶。
相關(guān)分析,通常我們可以用散點(diǎn)圖直接觀察。多組數(shù)據(jù)在二維平面內(nèi)打點(diǎn),尋找相關(guān)關(guān)系。
難道在于,在多維變量中剛剛好找到兩者呈線性關(guān)系很困難。需要兩兩作圖,那就老多了,做好后也就蒙圈了。
相關(guān)分析第二方法——特征值法。
也成相關(guān)矩陣法,有相關(guān)系數(shù)組成。這點(diǎn)就是課上學(xué)的 介于-1~1之間的相關(guān)系數(shù)了。
其背后的道理,雖然不深,但也足令人望而止步。
一般的命令為:
corr(X)——相關(guān)系數(shù)
cov(X)——相關(guān)矩陣
X就是你的數(shù)據(jù)矩陣了。