數(shù)理統(tǒng)計(jì)根據(jù)觀察或?qū)嶒?yàn)得到的數(shù)據(jù)來研究隨機(jī)現(xiàn)象,并對(duì)研究對(duì)象的客觀規(guī)律做出合理的估計(jì)和判斷
數(shù)理統(tǒng)計(jì)可以看成為逆向的概率論
有限的數(shù)據(jù)集被稱作 樣本
觀察對(duì)象所有的可能取值被稱作 總本
統(tǒng)計(jì)量是一種樣本函數(shù) 用來進(jìn)行統(tǒng)計(jì)推斷的工具
樣本均值和樣本方差是兩個(gè)重要的統(tǒng)計(jì)量
基本問題可以被分成兩大類: 參數(shù)估計(jì)和假設(shè)檢驗(yàn)
參數(shù)估計(jì)
參數(shù)估計(jì)是通過隨機(jī)抽取的樣本來估計(jì)總體分布的方法
-
點(diǎn)估計(jì) 具體方法包括矩估計(jì)法和最大似然估計(jì)法
矩估計(jì)法的思想在于用樣本 k 階矩估計(jì)總體的 k 階矩
最大似然估計(jì)的直觀理解是: 既然抽樣得到的是已有的樣本值, 就可以認(rèn)為取到這一組樣本值的概率較大,因而在估計(jì)參數(shù)的時(shí)候就需要讓已有的樣本值出現(xiàn)的可能性最大
估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)
- 無偏性 估計(jì)量的數(shù)學(xué)期望等于未知參數(shù)的真實(shí)值
- 有效性 無偏估計(jì)量的方法盡可能小
- 一致性 當(dāng)樣本容量趨近于無窮時(shí),估計(jì)量依概率收斂于位置參數(shù)的真實(shí)值
區(qū)間估計(jì)
通過參數(shù)估計(jì)出一個(gè)區(qū)間 這個(gè)區(qū)間叫做置信區(qū)間 這種方式叫做區(qū)間估計(jì)
置信區(qū)間: 對(duì)總體反復(fù)抽樣,確定的置信區(qū)間
置信水平: 置信區(qū)間中包含真實(shí)值的比值
區(qū)間估計(jì)相當(dāng)于在點(diǎn)估計(jì)的基礎(chǔ)上提供了取值范圍與界限
假設(shè)檢驗(yàn)
參數(shù)估計(jì)的對(duì)象是總體的某個(gè)參數(shù),假設(shè)檢驗(yàn)的對(duì)象則是關(guān)于總體的某個(gè)論斷,即是總體的假設(shè)
其中包含原假設(shè) H0和備假設(shè) H1,檢驗(yàn)過程就是根據(jù)樣本在 H0與 H1之間選擇一種接受
假設(shè)檢驗(yàn)的作用就是根據(jù)學(xué)習(xí)器在測(cè)實(shí)集上的性能推斷其泛化能力的強(qiáng)弱,并確定所得結(jié)論的精確程度,可以進(jìn)一步推廣為不同學(xué)習(xí)器的性能