SAS如何生成箱型圖(Box-Plot) 1--箱型圖簡介

1、什么是箱型圖(Box-Plot)?

箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計圖,因形狀如箱子而得名。箱線圖的繪制方法是:先找出一組數(shù)據(jù)的上邊緣、下邊緣、中位數(shù)和兩個四分位數(shù);然后, 連接兩個四分位數(shù)畫出箱體;再將上邊緣和下邊緣與箱體相連接,平均數(shù)、中位數(shù)在箱體中間。

箱型圖1

2、一般繪制箱型圖的步驟是什么?

箱形圖提供了一種只用5個點對數(shù)據(jù)集做簡單總結(jié)的方式。這5個點包括中點、Q1、Q3、分部狀態(tài)的高位和低位。箱形圖很形象地分為中心、延伸以及分布狀態(tài)的全部范圍。

  1. 畫數(shù)軸,度量單位大小和數(shù)據(jù)的單位一致,起點比最小值稍小,長度比該數(shù)據(jù)的全距稍長。
  2. 畫一個矩形盒,兩端邊的位置分別對應(yīng)數(shù)據(jù)的上下四分位數(shù)(Q3和Q1)。在矩形盒內(nèi)部中位數(shù)位置畫一條線段為中位線。
  3. 在Q3+1.5IQR和Q1-1.5IQR處畫兩條與中位線一樣的線段,這兩條線段為異常值截斷點,稱其為內(nèi)限;在Q3+3IQR和Q1-3IQR處畫兩條線段,稱其為外限。處于內(nèi)限以外位置的點表示的數(shù)據(jù)都是異常值,其中在內(nèi)限與外限之間的異常值為溫和的異常值(mild outliers),在外限以外的為極端的異常值(extreme outliers)。四分位距IQR=Q3-Q1。.
  4. 從矩形盒兩端邊向外各畫一條線段直到不是異常值的最遠點,表示該批數(shù)據(jù)正常值的分布區(qū)間。(上圖中并沒有顯示)
  5. 用“〇”標出溫和的異常值,用“*”標出極端的異常值。相同值的數(shù)據(jù)點并列標出在同一數(shù)據(jù)線位置上,不同值的數(shù)據(jù)點標在不同數(shù)據(jù)線位置上。至此一批數(shù)據(jù)的箱形圖便繪出了。統(tǒng)計軟件繪制的箱形圖一般沒有標出內(nèi)限和外限。

3、SAS中如何實現(xiàn)Boxplot?

SAS中實現(xiàn)箱型圖有很多方法,我這里先簡單用Sgplot過程步中的vbox語句,做一個小的演示,下一篇文章介紹詳細的SAS Box-Plot的生成方法。

Sgplot中的vbox語句:

proc sgplot data=sashelp.class;
   vbox height;
run;
箱型圖1

按Sex分組的箱型圖:

proc sgplot data=sashelp.class;
   vbox height / group=sex;
run;
箱型圖2

相關(guān)文章:
SAS如何生成箱型圖(Box-Plot) 2--SAS代碼介紹

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容