
最近在學(xué)習(xí)統(tǒng)計學(xué)相關(guān)的知識,在閱讀《Head First 統(tǒng)計學(xué)》的過程中,遇到了標(biāo)準(zhǔn)差這個概念,當(dāng)時理解的不是很透徹,就這樣略過閱讀下面的章節(jié)。
直到最近在學(xué)習(xí)PMP過程中看到了楊述老師對標(biāo)準(zhǔn)差概念的講解,雖然簡單,但是使我對標(biāo)準(zhǔn)差的理解一下子就提升了一大半,因此在這里我試著記錄下來,一來鞏固理解,二來測試一下自己是否真的理解到位了,畢竟,只有說的明白,才算是真的理解。
1. 標(biāo)準(zhǔn)差
對實際生活有什么作用?
籃球教練在招收球員入隊的時候,需要有一系列的指標(biāo)作為入隊標(biāo)準(zhǔn);當(dāng)兩個球員的身體素質(zhì)等都差不多的時候,就很難抉擇該選擇誰入隊,這時候標(biāo)準(zhǔn)差就是一個非常好的參考;
同樣,我們在做兩個球星的差距的時候,標(biāo)準(zhǔn)差就能非常有效的描述差距的大小。
1.1 科比 v.s 易建聯(lián)
西格瑪標(biāo)準(zhǔn)差其實是衡量數(shù)據(jù)或概率分布的曲線的胖瘦。


西格瑪小的表示概率穩(wěn)定。例如這里科比的表示他每場得30分的概率非常穩(wěn)定,換句換說,無論觀眾和隊友,只要科比一上場,大家心里都有數(shù),這30分是基本到手了。


但是如果同樣在NBA打球的易建聯(lián) 的上車,情況就不那么穩(wěn)定了,運氣好也能拿30分,運氣不好可能拿幾分都有。所以水平高低從標(biāo)準(zhǔn)差上一目了然。
2. 因此,標(biāo)準(zhǔn)差是什么

標(biāo)準(zhǔn)差是描述數(shù)據(jù)或概率分布的集中程度。標(biāo)準(zhǔn)差大小,數(shù)據(jù)/概率都離這個期望值不遠(yuǎn);反之,如果標(biāo)準(zhǔn)差大則表示數(shù)據(jù)/概率離期望值很遠(yuǎn),什么都有可能發(fā)生。
3. Q&A 問答環(huán)節(jié)
3.1 那么,用均值不也能體現(xiàn)兩個球員的差距嗎?
舉一個極端不穩(wěn)定的情況,一個球員上場要么得60分,要么得0分,那么均值看起來是30分,和科比一樣高呢。但是這樣的球員你敢在總決賽那天送他上場嗎?你送他上場,他送你上天。
因此均值顯然沒有體現(xiàn)事情的全部真像,你正在需要知道的是變化幅度(Variance)。均值給出了平均數(shù),而標(biāo)準(zhǔn)差給出了分散程度。
3.2 那么,標(biāo)準(zhǔn)差總是越小越好嗎?
不一定,如果你是找出每場發(fā)揮穩(wěn)定的球員,標(biāo)準(zhǔn)差小就是你要找的人;或者是你正在生存機器零件,標(biāo)準(zhǔn)差小那么零件越一致。
如果你準(zhǔn)備入職一家新公司準(zhǔn)備大干一場,如果這家公司工資的標(biāo)準(zhǔn)差很小,表示你大干一場或者不干都差不多,你也許應(yīng)該找一家標(biāo)準(zhǔn)差大的公司大干一場。
3.3 標(biāo)準(zhǔn)差和方差是什么關(guān)系
標(biāo)準(zhǔn)差的平方就是方差。由于在統(tǒng)計帶有負(fù)號的數(shù)據(jù)的時候,如果不用平方最后求出來的標(biāo)準(zhǔn)差可能為0,因此才產(chǎn)生了方差。具體兩者關(guān)系可以參考《Head First 統(tǒng)計》
3.4 最后,標(biāo)準(zhǔn)差的公式
就是方差的根號:
其中:x表示一組數(shù)據(jù)集內(nèi)的每一個數(shù)據(jù),u表示這組數(shù)據(jù)集的均值, n表示數(shù)據(jù)集內(nèi)的個數(shù)。
又可以簡化成: