概述
這個值指的是置信區(qū)間的左右兩端點距離均值的差值。[1]
置信區(qū)間又是什么?《女士品茶》一書中說,95%的置信區(qū)間不能簡單地說,真實參數(shù)有95%的概率位于這個區(qū)間內(nèi)。這樣理解是科學(xué)家普遍的理解,但是是錯誤的。應(yīng)該說,如果1位科學(xué)家長期采用95%的置信區(qū)間報告實驗結(jié)果,那么他寫的100篇報告,有95篇的真實參數(shù)是位于置信區(qū)間內(nèi)的。這就不涉及“概率”這兩個字,采用頻數(shù)派的觀點。
margin of error 與 樣本數(shù) 的關(guān)系
計算公式[2]
其中 1.96 是正態(tài)分布累積分布函數(shù)97.5%分位點。因為兩邊各留2.5%,左右加起來就是5%,于是中間的區(qū)間就是95%置信區(qū)間。是總體的標(biāo)準(zhǔn)差。
除以
就是樣本均值的標(biāo)準(zhǔn)差。(疑問:為什么不是除以 n - 1?)
margin of error是一個數(shù),并不是比例。有時候看到margin of error是3%、2.5%,那是因為均值也是以百分比形式存在的。就好像調(diào)查問卷得到的結(jié)果,支持度百分之幾。它的margin of error也以百分比形式寫。
可以這樣逆推嗎?
《初學(xué)者科學(xué)方法指南》p75頁,[3] 難以理解,也可能他們錯了
現(xiàn)在,讓我們稍微扭轉(zhuǎn)一下我們的想法。 假設(shè)我們面前有一大袋藍(lán)色和紅色乒乓球,但我們不知道袋子中藍(lán)色球和紅色球的比例。 因此,我們從袋子中隨機抽取 1000 個球作為樣本。 我們發(fā)現(xiàn)正好 500 個球是紅色的,500 個是藍(lán)色的。 表 5.3 告訴我們的是,我們可以 95% 確定袋子里有 470 到 530 個球是紅色的; 如果我們采集 20 個類似的樣本,我們預(yù)計 20 個樣本結(jié)果中有 19 個會落在 470 到 530 個紅球之間。
通過別人報告的margin of error就能推測樣本數(shù)嗎?
雖然不知道為什么能直接套用伯努利分布。它的方差是,所以最大值是
,對應(yīng)標(biāo)準(zhǔn)差最大值
。代入到上面提到過的公式,就能從MoE推算出
需要多大。這是否就是p76頁 table 4 的來源?
比如書上說如果報告支持度68%,95%的置信區(qū)間,margin of error 是 ±4%,那么可以推測樣本數(shù)是500左右。
解方程:n = (sqrt(0.68*(1-0.68))*1.96/0.04)^2,結(jié)果是。
驚訝!chat bing能解這個問題
AI已經(jīng)發(fā)展到這個地步了。

補充
There is much confusion over the interpretation of the probability attached to confidence intervals. To understand it we have to resort to the concept of repeated sampling. Imagine taking repeated samples of the same size from the same population. For each sample calculate a 95% confidence interval. Since the samples are different, so are the confidence intervals. We know that 95% of these intervals will include the population parameter. However, without any additional information we cannot say which ones! Thus with only one sample, and no other information about the population parameter, we can say there is a 95% chance of including the parameter in our interval. Note that this does not mean that we would expect with 95% probability that the mean from another sample is in this interval. In this case we are considering differences between two sample means, which is the subject of the next chapter. [4]
參考資料
[1]: Wikipedia Margin of error 詞條: This interval is called the confidence interval, and the radius (half the interval) is called the margin of error, corresponding to a 95% confidence level.
[2] stat303Moe
[3] A beginner's guide to scientific method
[4] bmj