數(shù)理統(tǒng)計根據(jù)觀察或實驗得到的數(shù)據(jù)來研究隨機現(xiàn)象,并對研究對象的客觀規(guī)律做出合理的估計和判斷
數(shù)理統(tǒng)計可以看成為逆向的概率論
有限的數(shù)據(jù)集被稱作 樣本
觀察對象所有的可能取值被稱作 總本
統(tǒng)計量是一種樣本函數(shù) 用來進行統(tǒng)計推斷的工具
樣本均值和樣本方差是兩個重要的統(tǒng)計量
基本問題可以被分成兩大類: 參數(shù)估計和假設檢驗
參數(shù)估計
參數(shù)估計是通過隨機抽取的樣本來估計總體分布的方法
-
點估計 具體方法包括矩估計法和最大似然估計法
矩估計法的思想在于用樣本 k 階矩估計總體的 k 階矩
最大似然估計的直觀理解是: 既然抽樣得到的是已有的樣本值, 就可以認為取到這一組樣本值的概率較大,因而在估計參數(shù)的時候就需要讓已有的樣本值出現(xiàn)的可能性最大
估計量的評價標準
- 無偏性 估計量的數(shù)學期望等于未知參數(shù)的真實值
- 有效性 無偏估計量的方法盡可能小
- 一致性 當樣本容量趨近于無窮時,估計量依概率收斂于位置參數(shù)的真實值
區(qū)間估計
通過參數(shù)估計出一個區(qū)間 這個區(qū)間叫做置信區(qū)間 這種方式叫做區(qū)間估計
置信區(qū)間: 對總體反復抽樣,確定的置信區(qū)間
置信水平: 置信區(qū)間中包含真實值的比值
區(qū)間估計相當于在點估計的基礎上提供了取值范圍與界限
假設檢驗
參數(shù)估計的對象是總體的某個參數(shù),假設檢驗的對象則是關于總體的某個論斷,即是總體的假設
其中包含原假設 H0和備假設 H1,檢驗過程就是根據(jù)樣本在 H0與 H1之間選擇一種接受
假設檢驗的作用就是根據(jù)學習器在測實集上的性能推斷其泛化能力的強弱,并確定所得結論的精確程度,可以進一步推廣為不同學習器的性能