數(shù)據(jù)離散程度刻畫的“進化史”

圖片發(fā)自簡書App

為什么要刻畫離散程度?

現(xiàn)在有兩個班級考試,每個班級都只有兩個同學(xué)。A班的成績是79,81。B班的成績是60,100。你會發(fā)現(xiàn)平均分都是80,但班級分數(shù)的內(nèi)部差異有著較大區(qū)別,離散程度就是用來刻畫數(shù)據(jù)之間的差異性。

從進化的角度聊離散程度

當我們的統(tǒng)計工具在某些方面無法滿足需要,或存在某種缺陷的時候,我們就需要對它們進行改進,我們將這一過程戲稱為“進化”。

圖片發(fā)自簡書App

(1)平均差

圖片發(fā)自簡書App

理解

從公式中看出,如果均值理解為數(shù)據(jù)的中心,絕對號表示距離,那么分子就可以表示數(shù)據(jù)到中心的總距離。分母是樣本量,所以整個公式可以理解為樣本到中心的平均絕對距離。

缺陷

我們發(fā)現(xiàn),平均差用絕對號度量距離,其在數(shù)學(xué)性質(zhì)上是連續(xù)但不可導(dǎo),這不利于在未來的建模中求極值,于是方差誕生了。

(2)樣本方差

圖片發(fā)自簡書App

理解

從公式上看,方差解決了平均差不可導(dǎo)的問題,利用二次函數(shù)代替了不光滑的絕對值。但意義是差不多的,大家可以將其理解為樣本到中心的平均二次距離。

缺陷

這一度量方法缺陷在于其量綱存在問題。由于使用了二次函數(shù),其量綱(單位)就和原始樣本數(shù)據(jù)不一致了,即量綱也出現(xiàn)了平方,不利于結(jié)果的解釋,所以標準差出現(xiàn)了。

(3)標準差

圖片發(fā)自簡書App

理解

標準差實際就是對方差開根號,這樣的好處就是在量綱上與原始數(shù)據(jù)保持了一致,便于解釋。

例如,有一組職員收入數(shù)據(jù),人均收入10000元,標準差為500元。這就可以被解讀為謝謝職員收入與10000元的平均偏差為500元。

思考

標準差的不足之處是什么呢?


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 1. 簡述相關(guān)分析和回歸分析的區(qū)別和聯(lián)系。 回歸分析和相關(guān)分析都是研究兩個或兩個以上變量之間關(guān)系的方法。 廣義上說...
    安也也閱讀 9,173評論 0 3
  • 數(shù)據(jù)的集中趨勢 眾數(shù) 是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,有可能沒有也有可能有多個。 中位數(shù) 中位數(shù),又稱中點數(shù),中值...
    當_下閱讀 5,775評論 5 8
  • 基本概念 統(tǒng)計是對數(shù)據(jù)進行收集、分析、展示和解讀的科學(xué)和藝術(shù),這句話聽起來很高深,但其實也沒必要非要把統(tǒng)計想得過于...
    拓季閱讀 11,397評論 0 6
  • 一、感恩 1.感恩父母養(yǎng)育,一直以來對我們的支持,及幫助帶孩子。 2.感恩同事單獨制作催化劑樣品 3.感恩同事為裝...
    807C2閱讀 191評論 0 0
  • #寫作100天計劃之#Loser 自傳 拒絕了拿到手的offer,重新進入找工作,投簡歷的焦慮期?;艘煌砩细铝?..
    大胡hu閱讀 179評論 0 0

友情鏈接更多精彩內(nèi)容