為什么說美國(guó)大選中的郵寄選票是減少無應(yīng)答誤差的關(guān)鍵?

作者? 胡婧煒

無應(yīng)答誤差指由于受訪者不作答而導(dǎo)致的收集到的數(shù)據(jù)值與數(shù)據(jù)真實(shí)值之間的差異。

以上個(gè)月的美國(guó)總統(tǒng)大選為例,那些遲到的郵寄選票起到了影響選舉結(jié)果的關(guān)鍵作用:如果它們最終被視作無效票,獲勝者可能是共和黨候選人特朗普,而不是民主黨候選人拜登了。

一部分人是否提交成功了選票(即等同于是否作答)起到了改變選舉結(jié)果的作用,這就是無應(yīng)答可能導(dǎo)致的誤差。

很多研究者或項(xiàng)目管理者在調(diào)查中都追求高應(yīng)答率(點(diǎn)擊閱讀如何科學(xué)計(jì)算應(yīng)答率?)。一些學(xué)術(shù)期刊在評(píng)審文章時(shí),哪怕是在概率抽樣的原則上妥協(xié),都不愿在應(yīng)答率上妥協(xié)。在沒有成本限制的情況下,應(yīng)答率高當(dāng)然不是壞事。

然而現(xiàn)實(shí)情況是,受訪者越來越不愿意作答已經(jīng)成為調(diào)查的普遍趨勢(shì)。應(yīng)答率的提高,尤其在接近臨界值時(shí),往往需要耗費(fèi)巨大的成本。據(jù)統(tǒng)計(jì),美國(guó)消費(fèi)者態(tài)度調(diào)查(Surveyof Consumer Attitudes,SCA)為了維持70%的應(yīng)答率,在1979年平均只需要給每個(gè)受訪者撥打4次電話,而在20年后則平均需要撥打8次電話(Curtin2000)。

時(shí)至今日,絕大多數(shù)人都會(huì)拒絕接聽陌生的電話,提高應(yīng)答率的成本更是可想而知。

所以問題來了,提高應(yīng)答率的努力是否值得?我們采集數(shù)據(jù)的一個(gè)終極目標(biāo)是獲得準(zhǔn)確的估值。我們真正擔(dān)憂的是無應(yīng)答導(dǎo)致的誤差,而非無應(yīng)答本身。所以當(dāng)我們盡一切努力提高應(yīng)答率時(shí),我們的一個(gè)基本前提假設(shè)是應(yīng)答率的提高可以減少無應(yīng)答誤差。但這個(gè)假設(shè)是否一定成立呢?

圖片來源于網(wǎng)絡(luò)

撲朔迷離:應(yīng)答率與無應(yīng)答誤差相關(guān)嗎?

100%的應(yīng)答率是最完美的狀況,如果一項(xiàng)調(diào)查的應(yīng)答率是100%,那么它的無應(yīng)答誤差就是0。而當(dāng)無應(yīng)答發(fā)生,無應(yīng)答誤差的產(chǎn)生便有了可能。

Peytchev(2013)在美國(guó)國(guó)家藥物使用與健康調(diào)查(National Survey on Drug Use and Health)的數(shù)據(jù)中發(fā)現(xiàn),在使用應(yīng)答率作為自變量、濫用心理治療處方藥的比例作為因變量的回歸分析中,因變量的70%的變動(dòng)可以歸因于自變量即應(yīng)答率的變動(dòng)。

而且,在控制了應(yīng)答率的影響后,年份對(duì)于濫用心理治療處方藥的影響作用不再顯著了——這意味著藥物濫用隨年份增加僅僅是表面現(xiàn)象,應(yīng)答率的變化改變了應(yīng)答人員的結(jié)構(gòu),從而導(dǎo)致實(shí)際能觀察到的濫用藥物的比例上升了,但這并不代表研究總體中濫用藥物的比例真正隨時(shí)間發(fā)生了改變。

但另一部分人的研究結(jié)果卻證明了低應(yīng)答率并不會(huì)對(duì)數(shù)據(jù)結(jié)果產(chǎn)生影響。Keeter等人(2000)比較了兩種不同的調(diào)查安排對(duì)數(shù)據(jù)結(jié)果的影響:一種調(diào)查安排是5天執(zhí)行期,最后達(dá)到的應(yīng)答率約為37%,另一種調(diào)查安排是2個(gè)月執(zhí)行期,最后達(dá)到的應(yīng)答率約為61%。

兩種調(diào)查安排使用的問卷內(nèi)容相同,盡管應(yīng)答率相差甚遠(yuǎn),然而兩種調(diào)查安排下有顯著差別的變量卻非常少。Curtin等人(2000)的研究也發(fā)現(xiàn)了類似的結(jié)果。他們使用消費(fèi)者態(tài)度調(diào)查(SCA)從1970年到1996年近20年的211次調(diào)查的數(shù)據(jù)來探索應(yīng)答率對(duì)調(diào)查結(jié)果的影響。消費(fèi)者態(tài)度調(diào)查采用的是電訪模式,每次隨著電話聯(lián)系次數(shù)的增加,應(yīng)答率不斷增加。

假設(shè)每次調(diào)查訪員聯(lián)系的次數(shù)減少,數(shù)據(jù)的結(jié)果會(huì)不一樣嗎?基于這樣一種的思路,Curtin等人依次比較了將需要拒訪逆轉(zhuǎn)的人從數(shù)據(jù)集中排除之后(應(yīng)答率降低5-10個(gè)百分點(diǎn))、將需要聯(lián)系5次以上才能訪問成功的人從數(shù)據(jù)集中排除之后(應(yīng)答率降低25個(gè)百分點(diǎn))、將需要聯(lián)系2次以上的人從數(shù)據(jù)集中排除之后(應(yīng)答率降低50個(gè)百分點(diǎn))的一些關(guān)鍵變量的統(tǒng)計(jì)結(jié)果,發(fā)現(xiàn)無論是排除哪一部分人,對(duì)最終的統(tǒng)計(jì)結(jié)果均沒有太大的影響。

應(yīng)答率不是決定無應(yīng)答誤差的唯一因素

事實(shí)上,應(yīng)答率并不是決定無應(yīng)答誤差的唯一因素。

評(píng)估無應(yīng)答誤差的常用公式由兩部分組成,一部分是無應(yīng)答率(ms/ns),另一部分是應(yīng)答者與無應(yīng)答者在估測(cè)變量(通常為一項(xiàng)研究所關(guān)注的因變量)上的差異。

舉例來說,如果一項(xiàng)調(diào)查的應(yīng)答率是70%,應(yīng)答者與無應(yīng)答者在估測(cè)變量上的差異是100,那么無應(yīng)答誤差為30(即30%*100);另一項(xiàng)調(diào)查的應(yīng)答率是40%,應(yīng)答者與無應(yīng)答者在估測(cè)變量上的差異為20,那么無應(yīng)答誤差為12(60%*20)。盡管后一項(xiàng)調(diào)查的應(yīng)答率更低,但是它的無應(yīng)答誤差并沒有更高,反而更低。

Goves和Peytcheva(2008)的研究很好的總結(jié)了應(yīng)答率和無應(yīng)答誤差之間的關(guān)系。在對(duì)59項(xiàng)調(diào)查中959項(xiàng)變量的meta-analysis分析中,他們發(fā)現(xiàn)無論是高應(yīng)答率還是低應(yīng)答率,都可能導(dǎo)致高的無應(yīng)答誤差,也可能導(dǎo)致低的無應(yīng)答誤差。

應(yīng)答率和無應(yīng)答誤差之間并沒有必然的聯(lián)系(如下圖所示)。而且,無應(yīng)答誤差的變化大多數(shù)是變量層面的,而非調(diào)查項(xiàng)目層面的。

所以,僅僅憑借應(yīng)答率的高低來判斷數(shù)據(jù)的好壞并不合理。

舉個(gè)實(shí)際的例子,如果我們希望了解全部成年人使用社交媒體的習(xí)慣和偏好,即便應(yīng)答率不斷提高,但如果作答的全是年輕人,那我們了解到的情況肯定還是有很大的偏差,因?yàn)槟贻p人和中老年人使用社交媒體的習(xí)慣和偏好肯定是不一樣的。

相反,如果年輕人和中老年人在使用社交媒體的習(xí)慣和偏少上沒有太大差異,那么,即便因?yàn)闆]有訪問到老年人而導(dǎo)致應(yīng)答率偏低,對(duì)數(shù)據(jù)結(jié)果也不會(huì)有太大影響。

總結(jié)

應(yīng)答率因?yàn)楹?jiǎn)單、可操行強(qiáng),經(jīng)常被當(dāng)作評(píng)估數(shù)據(jù)質(zhì)量好壞的關(guān)鍵指標(biāo)。然而,綜合本章全部的討論,應(yīng)答率并不是影響無應(yīng)答誤差的唯一因素。應(yīng)答者與無應(yīng)答者在估測(cè)變量上的差異也會(huì)對(duì)無應(yīng)答誤差產(chǎn)生影響。

因此當(dāng)我們?cè)谠u(píng)估一項(xiàng)調(diào)查的數(shù)據(jù)的好壞時(shí),并不能簡(jiǎn)單地僅僅靠應(yīng)答率的高低來做出判斷。另外,從成本的角度考慮,如果我們努力提高應(yīng)答率卻不能增加答題人群的多樣性,這樣的努力很有可能會(huì)徒勞無功。

回到文章開頭關(guān)于美國(guó)總統(tǒng)選舉的例子,為什么郵寄選票會(huì)對(duì)選舉的結(jié)果產(chǎn)生顛覆性的影響?

因?yàn)猷]寄選票的大多是支持民主黨的選民,他們與那些去投票點(diǎn)按時(shí)完成投票的選民(支持共和黨的選民更偏好去投票點(diǎn)投票)在選舉態(tài)度上有本質(zhì)區(qū)別,因此如果他們的選票沒有成功提交,選舉結(jié)果就會(huì)產(chǎn)生很大的誤差。如果這些郵寄選票的選民在選舉態(tài)度上是完全隨機(jī)的,那么無論他們的選票是否提交或者是否計(jì)數(shù),對(duì)選舉結(jié)果都不會(huì)有影響。

【參考文獻(xiàn)】

Curtin, Richard, Stanley Presser, and Eleanor Singer. 2000.?“The effects of response rate changes on the index of consumer sentiment.”?Public Opinion Quarterly?64 (4): 413–28.?

Groves, Robert M. and Emilia?Peytcheva. 2008.?“The impact of nonresponse rates on nonresponse bias: A meta-analysis.”?Public Opinion Quarterly?72 (2): 167–89.?

Keeter, Scott, Carolyn Miller, Andrew Kohut, Robert Groves, and Stanley Presser. 2000. “Consequences of Reducing Nonresponse in a Large National Telephone Survey.”?Public Opinion Quarterly?64:125–48.?

Peytchev, Andy. 2013.?“Consequences of Survey Nonresponse.”?The ANNALS of the American Academy of Political and Social Science?645: 88-111.?

歡迎訪問調(diào)研家官網(wǎng),申請(qǐng)免費(fèi)試用:www.surveyplus.cn

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容