樣本容量主要由人口規(guī)模、置信水平、誤差等因素決定。在抽樣調(diào)查中,樣本容量的確定很重要。因?yàn)闃颖救萘刻?,?huì)造成人力、物力和財(cái)力的很大浪費(fèi);樣本容量太小,會(huì)使抽樣誤差太大,使調(diào)查結(jié)果與實(shí)際情況相差很大,影響調(diào)查的效果。因此需要通過個(gè)個(gè)因素的權(quán)衡來設(shè)定合理的樣本量。
手動(dòng)計(jì)算公式
???????????????????????????????

注:計(jì)算機(jī)結(jié)果取整,取整邏輯為“四舍五入”
N = population size(人口規(guī)模)
釋義:研究產(chǎn)品的總使用用戶量。另人口規(guī)模超過20,000后,對(duì)最終樣本量大小的影響不大。
e = Margin of error (percentage in decimal form) (誤差范圍)
釋義:一個(gè)百分比,調(diào)查結(jié)果不可以反映整體人口的程度。誤差范圍越小,就越接近在給定置信水平下的確切答案。該值測試者自己定義,誤差越小需要的樣本量越大。
z = z-score(標(biāo)準(zhǔn)分?jǐn)?shù))
釋義:z-分?jǐn)?shù)是與數(shù)據(jù)點(diǎn)的平均值相比的標(biāo)準(zhǔn)差的數(shù)量。
注:這個(gè)字段理解難度較高,屬于統(tǒng)計(jì)學(xué)下的一個(gè)概念,和數(shù)據(jù)統(tǒng)計(jì)的正態(tài)分布相關(guān)。目前我們只需要通過和置信水平的對(duì)照表來使用即可,下面有標(biāo)準(zhǔn)分?jǐn)?shù)和置信水平的對(duì)照表
p =response distribution (相應(yīng)分布)
釋義:對(duì)每個(gè)調(diào)查問題偏向某一側(cè)的百分比。如果不知道的話就用50%,這樣可以獲取最大的樣本量。
confidence level (置信水平)
置信水平是一個(gè)統(tǒng)計(jì)數(shù)據(jù),表示研究人員對(duì)數(shù)據(jù)真正代表產(chǎn)品的用戶總量的信心。置信水平越高,樣本量越大??梢岳斫鉃檫@是一個(gè)期望值,通常使用95%作為置信水平,其他常用的置信水平有:80%、85%、90%、99%。
標(biāo)準(zhǔn)分?jǐn)?shù)對(duì)照表
?

?
樣本量線上計(jì)算器
“survey monkey”和“National Business Research Institute”均為專業(yè)的調(diào)研公司提供的兩種不同的計(jì)算器,但兩種計(jì)算結(jié)果相同,確定樣本量時(shí)根據(jù)自己需要取其一即可。
survey monkey:https://www.surveymonkey.com/mp/sample-size-calculator/#
注:需要使用到的字段,“使用產(chǎn)品的用戶總量”、“置信水平”、“誤差范圍”。
National Business Research Institute:https://www.nbrii.com/our-process/sample-size-calculator/
注:需要使用到的字段,“使用產(chǎn)品的用戶總量”、“置信水平”、“誤差范圍”、“相應(yīng)分布”