用python求置信區(qū)間-參數(shù)估計(jì)

image.png
image.png

抽取樣本, 樣本量為200

np.random.seed(42)

coffee_full = pd.read_csv('coffee_dataset.csv')
coffee_red = coffee_full.sample(200) #this is the only data you might actually get in the real world.
coffee_red.head()
image.png

計(jì)算樣本中喝咖啡的均值

(coffee_red[coffee_red['drinks_coffee'] == True]['height'].mean()
>68.11962990858618

重復(fù)抽取樣本,計(jì)算其他樣本中喝咖啡的均值,得到抽樣分布

boot_means = []
for _ in range(10000):
    bootsample = coffee_full.sample(200, replace=True)
    mean = bootsample[bootsample['drinks_coffee'] == False]['height'].mean()
    boot_means.append(mean)

繪制抽樣分布


image.png

計(jì)算抽樣分布的置信區(qū)間以估計(jì)總體均值, 置信度95%

np.percentile(boot_means, 2.5), np.percentile(boot_means, 97.5)

(65.7156685999191, 67.17367777514218)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 統(tǒng)計(jì)學(xué)有兩大主要分支,分別是描述性統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)學(xué)。描述性統(tǒng)計(jì)學(xué)用于描述和概括數(shù)據(jù)的特征以及繪制各類統(tǒng)計(jì)圖表???..
    魚心DrFish閱讀 6,917評(píng)論 3 16
  • 十二、為什么均值重要 原文:Why the Mean Matters 譯者:飛龍 協(xié)議:CC BY-NC-SA 4...
    布客飛龍閱讀 2,277評(píng)論 0 2
  • 引入 嘗試根據(jù)統(tǒng)計(jì)量來推斷總體參數(shù), 例如釣魚如果撒一張網(wǎng)調(diào)到魚的可能性更大, 那么這個(gè)網(wǎng)需要多大呢 那么網(wǎng)越大,...
    IntoTheVoid閱讀 3,496評(píng)論 0 11
  • 十一、估計(jì) 原文:Estimation 譯者:飛龍 協(xié)議:CC BY-NC-SA 4.0 自豪地采用谷歌翻譯 在前...
    布客飛龍閱讀 1,070評(píng)論 0 2
  • 我三十二歲了,07年先后住了三次院,第三次整整一個(gè)月,三十二歲之前,我身康體健,從未生過病,打針吃藥都沒有,唯一兩...
    波妮燦閱讀 185評(píng)論 0 0

友情鏈接更多精彩內(nèi)容