分位數(shù)與箱線圖

1.概念

????統(tǒng)計(jì)學(xué)術(shù)語,如果將一組數(shù)據(jù)從小到大排序,并計(jì)算相應(yīng)的累計(jì)百分位,則某一百分位所對(duì)應(yīng)數(shù)據(jù)的值就稱為這一百分位的百分位數(shù)。可表示為:一組n個(gè)觀測(cè)值按數(shù)值大小排列如,處于p%位置的值稱第p百分位數(shù)。
????比如,中位數(shù)就是第50百分位數(shù),第25百分位數(shù)又稱第一個(gè)四分位數(shù)(First Quartile),較小四分位數(shù),用Q1表示;第50百分位數(shù)又稱第二個(gè)四分位數(shù)(Second Quartile),用Q2表示;第75百分位數(shù)又稱第三個(gè)四分位數(shù)(Third Quartile),較大四分位數(shù),用Q3表示。若求得第p百分位數(shù)為小數(shù),可完整為整數(shù)。第三四分位數(shù)與第一四分位數(shù)的差距又稱四分位距(InterQuartile Range,IQR)第p百分位數(shù)是這樣一個(gè)值,它使得至少有p%的數(shù)據(jù)項(xiàng)小于或等于這個(gè)值,且至少有(100-p)%的數(shù)據(jù)項(xiàng)大于或等于這個(gè)值

2.計(jì)算過程

????數(shù)字按從小到大排序,主要選擇四分位的百分比值p,及樣本總量n有以下數(shù)學(xué)公式可以表示:
L_{p}=n*\frac{p}{100}

  • 如果L是一個(gè)整數(shù),則取第L 和 第L+1的平均值
  • 如果L不是一個(gè)整數(shù),則取下一個(gè)最近的整數(shù)。(比如L = 1.2,則取2)

3.例子

????高等院校的入學(xué)考試成績經(jīng)常以百分位數(shù)的形式報(bào)告。比如,假設(shè)某個(gè)考生在入學(xué)考試中的語文部分的原始分?jǐn)?shù)為54分。相對(duì)于參加同一考試的其他學(xué)生來說,他的成績?nèi)绾尾⒉蝗菀字?。但是如果原始分?jǐn)?shù)54分恰好對(duì)應(yīng)的是第70百分位數(shù),我們就能知道大約70%的學(xué)生的考分比他低,而約30%的學(xué)生考分比他高。
????假如:有10個(gè)數(shù):1、2、3、4、5、6、7、8、9、10 按由小到大將其排列。求它的第90%百分位,也就是第9個(gè)數(shù)剛好是9 ,那么90%分位數(shù)就是9 。例子來自我是攻城獅

4.箱線圖

箱線圖就是四分位數(shù)的可視化表現(xiàn)


boxplot.jpg

所以通過這個(gè)圖可以看到一組數(shù)據(jù)的分布狀態(tài)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容