一、置信區(qū)間的估計
1.統計推斷:統計推斷是基于樣本統計量對總體參數給出統計學結論
2.常用方法:置信區(qū)間估計和假設檢驗
3.95%置信度的含義:100次抽樣結果的100個95%置信區(qū)間中,平均而言有95個置信區(qū)間包含了真實的總體均數。置信度常用C表示
二、置信區(qū)間
(1)已知σ時μ的置信區(qū)間
1.樣本量為n的簡單隨機抽樣數據,估計總體均數μ的置信區(qū)間,當總體分布服從正態(tài)分布時,樣本均數μ服從
2.對于一個觀察到的樣本,μ的置信度為C的置信區(qū)間為,其中
為μ的估計值,
為誤差范圍
3.和C的關系為C越大則
越大
(2)置信區(qū)間的誤差范圍
1. 高置信度是指結果準確性高,誤差范圍小是指結果精確性高
2. 減小置信區(qū)間誤差范圍的方法:
①選擇較低的置信度,從而得到更小的
②選擇更大的樣本量n;
③減小σ
三、置信區(qū)間與樣本量
1.合理的樣本設計應在進行數據收集前先確定好統計推斷方法,確定足夠的樣本量可使得后期置信區(qū)間的誤差范圍較小。
2.根據置信區(qū)間誤差范圍計算公式,計算簡單隨機抽樣的樣本量:
3.實際應用中,樣本量大小的選擇,除上述公式計算結果外,還應考慮其他因素,如數據收集過程中所花費的成本等,確保研究方案實施的可行性。
4.嚴謹的設計通常會事先假定一個無應答率,并以此校正樣本量的計算。
四、注意事項
1.公式不適用于所有抽樣方法,不同的抽樣方法需要采用不同估計公式。
2. 公式適用條件
(1)數據必須來自相應總體的簡單隨機抽樣;
(2)個體間相互獨立;
(3)事先假定總體標準差已知,實際研究中很可能無法得到總體標準差。
3.選用統計方法前需對數據進行探索性分析,檢查異常值以及數據是否服從正態(tài)分布;
4. 統計分析無法拯救糟糕的數據;
5. 實際操作中的問題(如無應答與失訪)會給抽樣研究帶來額外的誤差,這些誤差可能比隨機抽樣誤差大得多,并且研究結果中這些誤差并不能被誤差范圍所反映;
6. 統計推斷的概率是指該方法重復進行的正確頻率,但并不知道某一次結果的正確性。