
一、母體與樣本
母體:包含針對(duì)某一特定決策或調(diào)查的所有研究對(duì)象
樣本:母體的子集
二、位置量數(shù)
提供了一個(gè)單數(shù)值的估計(jì)值,這個(gè)估計(jì)值以某種方式代表著數(shù)據(jù)集中的“中心”。包括:算術(shù)平均數(shù)、中位數(shù)、眾數(shù)、中列數(shù)
算術(shù)平均數(shù)(平均值average):母體的平均值用μ來表示,Xˉ為樣本均值
中位數(shù)(Median):數(shù)據(jù)從小到大排列時(shí),規(guī)定中間數(shù)值的位置量數(shù)是中位數(shù)。
眾數(shù)(mode.sngl):出現(xiàn)次數(shù)最多的那個(gè)觀測(cè)值。
中列數(shù):數(shù)據(jù)集中最大值與最小值之間的平均值。
三、離散量數(shù)
離散:數(shù)據(jù)的分散程度,也就是說,數(shù)據(jù)在數(shù)值上的分散(或者集中)。描述離散的統(tǒng)計(jì)學(xué)量數(shù)有:全距、方差、標(biāo)準(zhǔn)差
全距:一個(gè)數(shù)據(jù)集內(nèi)最大數(shù)據(jù)與最小數(shù)據(jù)之差。(max-min)
四分位距(IRQ,或者中點(diǎn)分配):第一個(gè)四分位數(shù)與第三個(gè)四分位數(shù)之差,Q3-Q1,通常稱為四分位距(IQR),也稱為中點(diǎn)分配。
方差(Variance):在概率論和統(tǒng)計(jì)學(xué)中,一個(gè)隨機(jī)變量的方差描述的是它的離散程度,也就是該變量離其期望值的距離。一個(gè)實(shí)隨機(jī)變量的方差也稱為它的二階矩或二階中心動(dòng)差,恰巧也是它的二階累積量。
方差越大,意味著以平均值為中心而擴(kuò)散的數(shù)據(jù)越多,在觀察值中也會(huì)出現(xiàn)更多的變異。
母體方差的計(jì)算公式為:? ? (其中Xi是第i項(xiàng),N是母體中的觀察數(shù)目,)
樣本方差的計(jì)算公式為:
標(biāo)準(zhǔn)差:方差的平方根。
母體方差的計(jì)算公式為(STDEV.P):
樣本方差的計(jì)算公式為(STDEV.S):
切比雪夫定理:任意一個(gè)數(shù)據(jù)集中,位于其平均數(shù)m個(gè)標(biāo)準(zhǔn)差范圍內(nèi)的比例(或部分)總是至少為1-1/㎡,其中m為大于1的任意正數(shù)。因此當(dāng)m=2時(shí),,至少有3/4(或75%)的數(shù)據(jù)位于平均數(shù)2個(gè)標(biāo)準(zhǔn)差范圍內(nèi)。當(dāng)m=3時(shí),至少有8/9(或89%)的數(shù)據(jù)位于平均數(shù)3個(gè)標(biāo)準(zhǔn)差范圍內(nèi)。這樣的話,我們只要運(yùn)用計(jì)算出來的平均值和標(biāo)準(zhǔn)差,便可以用這些數(shù)值來從根本上理解數(shù)據(jù)集的偏差。
經(jīng)驗(yàn)規(guī)則:(s至標(biāo)準(zhǔn)差)
1,大約68%的觀察值將位于距離平均值的1個(gè)標(biāo)準(zhǔn)差范圍內(nèi),或者介于“x拔-s”或“x拔+s”之間。
2,大約95%的觀察值將位于距離平均值的2個(gè)標(biāo)準(zhǔn)差范圍內(nèi),或者介于“x拔-2s”或“x拔+2s”之間。
3,大約99.7%的觀察值將位于距離平均值的3個(gè)標(biāo)準(zhǔn)差范圍內(nèi),或者介于“x拔-3s”或“x拔+3s”之間。
工序能力指數(shù)(cp):表示工序能力對(duì)設(shè)計(jì)的產(chǎn)品規(guī)范的保證程度。評(píng)價(jià)加工工藝系統(tǒng)滿足加工技術(shù)要求的程度。
cp=(規(guī)格上限-規(guī)格下限)\總偏差
標(biāo)準(zhǔn)化值(z~分?jǐn)?shù))(standardize):提供了觀察值與平均均值之間的相對(duì)的距離測(cè)量指標(biāo),不受測(cè)量單位影響。數(shù)據(jù)集中的第i個(gè)觀察值的z分?jǐn)?shù),公式:
Zi=(Xi-X拔)/s
變異系數(shù)(cv):提供了數(shù)據(jù)中離散程度的相對(duì)測(cè)量,CV=標(biāo)準(zhǔn)差/平均差
四、形態(tài)量數(shù):
偏度:描述了缺乏對(duì)稱的數(shù)據(jù)的分布形態(tài)
正偏度:分布形態(tài)向右側(cè)“縮小”
負(fù)偏度:分布形態(tài)向左側(cè)“縮小”
偏度系數(shù)(cs):測(cè)量觀察值圍繞平均值的不對(duì)稱程度。
單峰:只有一個(gè)峰的直方圖成為雙峰
雙峰:有兩個(gè)峰的直方圖稱為雙峰
峰度:直方圖的尖峰度(即高而窄的形態(tài))或平坦度(即矮而平坦的形態(tài))
峰度系數(shù)(ck):測(cè)量母體的峰度
公式:
六、分類數(shù)據(jù)的描述統(tǒng)計(jì)量數(shù)
比例:正規(guī)的統(tǒng)計(jì)量數(shù),用p表示。
八、關(guān)聯(lián)量數(shù)
協(xié)方差:測(cè)量?jī)蓚€(gè)變量X與Y之間線性關(guān)聯(lián)的量數(shù)。
相關(guān):測(cè)量X與Y兩個(gè)變量之間線性關(guān)聯(lián)的量數(shù),它并不取決于測(cè)量的單位,相關(guān)是通過相關(guān)系數(shù)來測(cè)量的。
相關(guān)系數(shù)(皮爾森積距相關(guān)系數(shù)):協(xié)方差除以標(biāo)準(zhǔn)差之積。
樣本相關(guān)系數(shù)
九、極端值
極端值:數(shù)據(jù)中特別大或特別小的值,它們可以使我們從統(tǒng)計(jì)分析中獲得的結(jié)果顯著改變。
十、商業(yè)決策中的統(tǒng)計(jì)思維
統(tǒng)計(jì)思維:是一種學(xué)習(xí)的理念和不斷優(yōu)化的行動(dòng),它基于以下這些原因:
1、所有工作都在相互關(guān)聯(lián)的流程組成的一個(gè)系統(tǒng)中發(fā)生。2、在所有過程中所有,偏差始終存在。3、更優(yōu)異的績(jī)效,來自于理解和減少偏差。