散點圖、直方圖和相關系數(shù)矩陣,一行命令輕松搞定

在做分析之前,我們會先進行探索性數(shù)據(jù)分析,我們想先看看多個變量之間的分布和他們的相關性,以便尋找關系來指導我們后續(xù)的分析,今天我們就一起來學習。

今天所用的例子是R語言pairs.panels幫助文件的例子,數(shù)據(jù)是R自帶的iris數(shù)據(jù)集,類型是data.frame,直接用就可以了。該數(shù)據(jù)集包含150個數(shù)據(jù)樣本,5個變量:花萼長度(Sepal.Length),花萼寬(Sepal.Width),花瓣長度(Petal.Length),花瓣寬度(Petal.Width)和鳶尾花卉種(Species),用命令View(iris)即可查看。

開始繪制:

library(psych)#加載做圖包
data(iris)#讀取數(shù)據(jù)
pairs.panels(iris[1:4],#選取數(shù)據(jù)集的前四列進行繪制
bg=c("red","yellow","blue")[iris$Species],#顯示顏色分組,Species共分成三類
pch=21,#散點的形狀
stars=TRUE,#star顯示顯著性
main="Fisher Iris data by Species")

結(jié)果如圖:

我們可以改變對角線直方圖的顏色,并且每組的散點形狀用不同形狀表示

pairs.panels(iris[1:4],bg=c("red","yellow","blue")[iris$Species],
? ? ? ? pch=21+as.numeric(iris$Species),#每組的散點以不同的形式展示
? ? ? ? stars=TRUE,#star顯示顯著性
? ? ? ? main="Fisher Iris data by Species",hist.col="red")

結(jié)果如圖:

結(jié)果解讀:對角線是直方圖;在對角線上方,是顯示顯著性的相關字數(shù)矩陣;對角線下方是散點圖。每個散點圖中呈橢圓形的對象成為相關橢圓,它越被拉伸,其相關性越強。橢圓中心的點表示x軸變量和y軸變量的均值所確定的點,散點圖中繪制的曲線稱為局部回歸平滑曲線。

本例子所使用的變量全部是定量變量;如果是定性變量,對角線上的直方圖會變成直條圖。

歡迎大家關注我們的公眾號

統(tǒng)計練習題

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容