在做分析之前,我們會先進行探索性數(shù)據(jù)分析,我們想先看看多個變量之間的分布和他們的相關性,以便尋找關系來指導我們后續(xù)的分析,今天我們就一起來學習。
今天所用的例子是R語言pairs.panels幫助文件的例子,數(shù)據(jù)是R自帶的iris數(shù)據(jù)集,類型是data.frame,直接用就可以了。該數(shù)據(jù)集包含150個數(shù)據(jù)樣本,5個變量:花萼長度(Sepal.Length),花萼寬(Sepal.Width),花瓣長度(Petal.Length),花瓣寬度(Petal.Width)和鳶尾花卉種(Species),用命令View(iris)即可查看。
開始繪制:
library(psych)#加載做圖包data(iris)#讀取數(shù)據(jù)pairs.panels(iris[1:4],#選取數(shù)據(jù)集的前四列進行繪制
bg=c("red","yellow","blue")[iris$Species],#顯示顏色分組,Species共分成三類
pch=21,#散點的形狀
stars=TRUE,#star顯示顯著性
main="Fisher Iris data by Species")結(jié)果如圖:

我們可以改變對角線直方圖的顏色,并且每組的散點形狀用不同形狀表示
pairs.panels(iris[1:4],bg=c("red","yellow","blue")[iris$Species],
? ? ? ? pch=21+as.numeric(iris$Species),#每組的散點以不同的形式展示
? ? ? ? stars=TRUE,#star顯示顯著性
? ? ? ? main="Fisher Iris data by Species",hist.col="red")結(jié)果如圖:

結(jié)果解讀:對角線是直方圖;在對角線上方,是顯示顯著性的相關字數(shù)矩陣;對角線下方是散點圖。每個散點圖中呈橢圓形的對象成為相關橢圓,它越被拉伸,其相關性越強。橢圓中心的點表示x軸變量和y軸變量的均值所確定的點,散點圖中繪制的曲線稱為局部回歸平滑曲線。
本例子所使用的變量全部是定量變量;如果是定性變量,對角線上的直方圖會變成直條圖。
歡迎大家關注我們的公眾號
統(tǒng)計練習題