數(shù)學(xué)基礎(chǔ): 數(shù)理統(tǒng)計(jì)

數(shù)理統(tǒng)計(jì)根據(jù)觀察或?qū)嶒?yàn)得到的數(shù)據(jù)來研究隨機(jī)現(xiàn)象,并對(duì)研究對(duì)象的客觀規(guī)律做出合理的估計(jì)和判斷

數(shù)理統(tǒng)計(jì)可以看成為逆向的概率論
有限的數(shù)據(jù)集被稱作 樣本
觀察對(duì)象所有的可能取值被稱作 總本
統(tǒng)計(jì)量是一種樣本函數(shù) 用來進(jìn)行統(tǒng)計(jì)推斷的工具
樣本均值和樣本方差是兩個(gè)重要的統(tǒng)計(jì)量
基本問題可以被分成兩大類: 參數(shù)估計(jì)和假設(shè)檢驗(yàn)

參數(shù)估計(jì)

參數(shù)估計(jì)是通過隨機(jī)抽取的樣本來估計(jì)總體分布的方法

  1. 點(diǎn)估計(jì) 具體方法包括矩估計(jì)法和最大似然估計(jì)法

    矩估計(jì)法的思想在于用樣本 k 階矩估計(jì)總體的 k 階矩

    最大似然估計(jì)的直觀理解是: 既然抽樣得到的是已有的樣本值, 就可以認(rèn)為取到這一組樣本值的概率較大,因而在估計(jì)參數(shù)的時(shí)候就需要讓已有的樣本值出現(xiàn)的可能性最大

    估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn)

    • 無偏性 估計(jì)量的數(shù)學(xué)期望等于未知參數(shù)的真實(shí)值
    • 有效性 無偏估計(jì)量的方法盡可能小
    • 一致性 當(dāng)樣本容量趨近于無窮時(shí),估計(jì)量依概率收斂于位置參數(shù)的真實(shí)值
  2. 區(qū)間估計(jì)
    通過參數(shù)估計(jì)出一個(gè)區(qū)間 這個(gè)區(qū)間叫做置信區(qū)間 這種方式叫做區(qū)間估計(jì)
    置信區(qū)間: 對(duì)總體反復(fù)抽樣,確定的置信區(qū)間
    置信水平: 置信區(qū)間中包含真實(shí)值的比值
    區(qū)間估計(jì)相當(dāng)于在點(diǎn)估計(jì)的基礎(chǔ)上提供了取值范圍與界限

假設(shè)檢驗(yàn)

參數(shù)估計(jì)的對(duì)象是總體的某個(gè)參數(shù),假設(shè)檢驗(yàn)的對(duì)象則是關(guān)于總體的某個(gè)論斷,即是總體的假設(shè)
其中包含原假設(shè) H0和備假設(shè) H1,檢驗(yàn)過程就是根據(jù)樣本在 H0與 H1之間選擇一種接受
假設(shè)檢驗(yàn)的作用就是根據(jù)學(xué)習(xí)器在測(cè)實(shí)集上的性能推斷其泛化能力的強(qiáng)弱,并確定所得結(jié)論的精確程度,可以進(jìn)一步推廣為不同學(xué)習(xí)器的性能

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容