
圖片發(fā)自簡書App
為什么要刻畫離散程度?
現(xiàn)在有兩個班級考試,每個班級都只有兩個同學(xué)。A班的成績是79,81。B班的成績是60,100。你會發(fā)現(xiàn)平均分都是80,但班級分數(shù)的內(nèi)部差異有著較大區(qū)別,離散程度就是用來刻畫數(shù)據(jù)之間的差異性。
從進化的角度聊離散程度
當我們的統(tǒng)計工具在某些方面無法滿足需要,或存在某種缺陷的時候,我們就需要對它們進行改進,我們將這一過程戲稱為“進化”。

圖片發(fā)自簡書App
(1)平均差

圖片發(fā)自簡書App
理解
從公式中看出,如果均值理解為數(shù)據(jù)的中心,絕對號表示距離,那么分子就可以表示數(shù)據(jù)到中心的總距離。分母是樣本量,所以整個公式可以理解為樣本到中心的平均絕對距離。
缺陷
我們發(fā)現(xiàn),平均差用絕對號度量距離,其在數(shù)學(xué)性質(zhì)上是連續(xù)但不可導(dǎo),這不利于在未來的建模中求極值,于是方差誕生了。
(2)樣本方差

圖片發(fā)自簡書App
理解
從公式上看,方差解決了平均差不可導(dǎo)的問題,利用二次函數(shù)代替了不光滑的絕對值。但意義是差不多的,大家可以將其理解為樣本到中心的平均二次距離。
缺陷
這一度量方法缺陷在于其量綱存在問題。由于使用了二次函數(shù),其量綱(單位)就和原始樣本數(shù)據(jù)不一致了,即量綱也出現(xiàn)了平方,不利于結(jié)果的解釋,所以標準差出現(xiàn)了。
(3)標準差

圖片發(fā)自簡書App
理解
標準差實際就是對方差開根號,這樣的好處就是在量綱上與原始數(shù)據(jù)保持了一致,便于解釋。
例如,有一組職員收入數(shù)據(jù),人均收入10000元,標準差為500元。這就可以被解讀為謝謝職員收入與10000元的平均偏差為500元。
思考
標準差的不足之處是什么呢?