統(tǒng)計(jì)學(xué)|常見(jiàn)統(tǒng)計(jì)謬誤

今天這篇文章,和大家分享幾個(gè)最常見(jiàn)的統(tǒng)計(jì)學(xué)謬誤。

(1)辛普森悖論(Simpson's Paradox)

辛普森悖論,指的是在分組比較中都占優(yōu)勢(shì)的一方,在總評(píng)中反而成為失勢(shì)的一方。


上圖顯示的是某大學(xué)法學(xué)院和商學(xué)院招生的數(shù)據(jù)統(tǒng)計(jì)。我們可以看到,法學(xué)院男生的錄取比例為8/53=15.1%,女生錄取的比例為51/152=33.6%。同理,商學(xué)院男生的錄取比例為80.1%,女生的錄取比例為91.1%。

無(wú)論在法學(xué)院還是在商學(xué)院,女生的錄取比例都高于男生。本文的男性讀者讀到這里,可能會(huì)感到一絲不平。

現(xiàn)在我們把兩個(gè)學(xué)院錄取的男女生人數(shù)相加,再來(lái)做一下統(tǒng)計(jì)。


男生錄取的比例為209/304=68.8%。女生錄取的比例為143/253=56.5%。男生的錄取率要高于女生。這下,恐怕要輪到女生感到不公了。

那么問(wèn)題來(lái)了:該大學(xué)的招生政策,到底有沒(méi)有性別歧視?如果有,是歧視男生還是女生?

辛普森悖論告訴我們,很多時(shí)候,在分析數(shù)據(jù)的時(shí)候,不能簡(jiǎn)單的將分組數(shù)據(jù)匯總相加。我們需要仔細(xì)觀察分組數(shù)據(jù)的特征。比如在上面這個(gè)例子中,法學(xué)院的錄取率要遠(yuǎn)遠(yuǎn)低于商學(xué)院,而大多數(shù)男生選擇申請(qǐng)商學(xué)院。因此即使男生在法學(xué)院的申請(qǐng)中被拒率很高,被拒掉的絕對(duì)數(shù)量卻不見(jiàn)得多。女生的情況,則恰恰相反。

在我們得出任何基于統(tǒng)計(jì)分析的結(jié)論前,先認(rèn)真想一想,該結(jié)論是不是符合常識(shí)?有沒(méi)有可能被表面的數(shù)據(jù)掩蓋了背后的真相?這是我們能夠從辛普森悖論中學(xué)到的教訓(xùn)。

(2)基本比率謬誤(Base Rate Fallacy)

讓我先用一個(gè)簡(jiǎn)單的例子幫助大家理解基本比率謬誤這個(gè)概念。

假設(shè)小紅熱愛(ài)音樂(lè),幾乎每天在家里彈鋼琴,有時(shí)候還友情客串朋友的宴會(huì)為大家演奏一曲。 現(xiàn)在請(qǐng)問(wèn),小紅的職業(yè)是什么?

在沒(méi)有其他信息的前提下,你應(yīng)該選擇B)會(huì)計(jì),而非A)琴師。主要原因在于,從事會(huì)計(jì)的人口數(shù)量,要遠(yuǎn)遠(yuǎn)高于從事琴師工作的人口數(shù)。這個(gè)數(shù)量,就叫做基本比率(Base Rate)。

再舉個(gè)例子。乳房影像檢查(Mammography),在幫助女性排查乳腺癌中應(yīng)用廣泛。事實(shí)上不少機(jī)構(gòu)都鼓勵(lì)40歲以上的女性每年在體檢中包括乳房影像檢查,以確認(rèn)自己是否患上乳腺癌。

以一個(gè)40歲左右的女性為例?;诿绹?guó)的統(tǒng)計(jì)數(shù)據(jù),該女性患有乳腺癌的概率大約為1%左右。【注意,這個(gè)比率和一位女性一生中查出乳腺癌的概率是兩個(gè)概念。根據(jù)美國(guó)的數(shù)據(jù),到80歲查出乳腺癌的概率為12%左右?!?/p>

如果她選擇通過(guò)乳房影像檢查來(lái)測(cè)試自己是否患上乳腺癌,檢查結(jié)果出現(xiàn)誤差(即被誤診患上乳腺癌)的概率為9%左右。

那么問(wèn)題來(lái)了:如果一位女性病人去做了一個(gè)乳房影像檢查,測(cè)試結(jié)果顯示她患上乳腺癌。她真正患上乳腺癌的概率是多少?

很多人可能會(huì)回答91%,因?yàn)槿榉坑跋駲z查出現(xiàn)誤診的概率為9%。但這是錯(cuò)誤的答案。


事實(shí)上,她患上乳腺癌的概率僅為9%。計(jì)算過(guò)程如上圖所示。由于患上乳腺癌的女性的基本比率(Base Rate)本來(lái)就很小,再加上乳房影像檢查自身帶有的誤診率,因此導(dǎo)致最后測(cè)試結(jié)果為患癌的人群,其實(shí)只有9%左右真的患上了乳腺癌。

這個(gè)例子告訴我們,在我們做出任何判斷前,首先需要對(duì)基本比率有個(gè)大致的認(rèn)識(shí),否則很容易不小心就陷入統(tǒng)計(jì)的陷阱。

(3)羅杰斯現(xiàn)象(Will Rogers Phenomenon)

羅杰斯現(xiàn)象指的是,在做數(shù)據(jù)統(tǒng)計(jì)時(shí),如果把一個(gè)樣本從一個(gè)組移去另一個(gè)組,會(huì)同時(shí)提升兩個(gè)組的平均值。

一些讀者看到這句話(huà),可能會(huì)覺(jué)得不可思議。讓我通過(guò)一個(gè)例子來(lái)給大家解釋一下。

假設(shè)有6個(gè)人,分別為40、50、60、70、80、和90歲?,F(xiàn)在將他們分為兩組。第一組包括40歲和50歲的兩人,因此組平均年齡為45歲。剩下的歸入第二組,因此組平均年齡為75歲。


現(xiàn)在把第二組中的那位60歲的哥們,移去第一組。移過(guò)去以后,第一組的平均年齡變?yōu)?0歲,而第二組的平均年齡變?yōu)?0歲。兩組的平均年齡都上升了。

羅杰斯現(xiàn)象,導(dǎo)致我們?cè)卺t(yī)學(xué)領(lǐng)域產(chǎn)生一些容易讓人混淆的,似是而非的結(jié)論。

舉例來(lái)說(shuō),前列腺特異抗原測(cè)試(PSA測(cè)試)可以幫助我們?cè)\斷前列腺癌。在沒(méi)有發(fā)明這項(xiàng)測(cè)試前,很多人患了前列腺癌卻不自知,因此他們被歸入“健康”人群。而那些被確診前列腺癌的患者,被歸入“患者”人群。

有了PSA測(cè)試這項(xiàng)技術(shù)以后,很多人在年紀(jì)輕輕時(shí)也能通過(guò)該測(cè)試確診自己是否患上前列腺癌。這部分人,就被移出“健康”人群,歸入“患者”人群。

由于這個(gè)歸類(lèi)的變化,導(dǎo)致患上前列腺癌的“患者”人群,以及“健康”人群的平均壽命都得到了提高。因?yàn)椤敖】怠比巳褐斜灰迫ヒ徊糠职┌Y患者,而這些癌癥患者屬于“輕度病患”(前列腺癌的致死率很低),因此“健康”和“患者”兩個(gè)人群的壽命平均值均得到了提升,讓人誤以為PSA測(cè)試能夠幫助我們延長(zhǎng)壽命。

【注:如果你沒(méi)有看懂這個(gè)例子,可以嘗試回過(guò)頭去再讀一遍,多想想就能明白了。】

(4)伯克森悖論(Berkson's Paradox)

伯克森悖論,指的是兩個(gè)本來(lái)無(wú)關(guān)的變量之間體現(xiàn)出貌似強(qiáng)烈的相關(guān)關(guān)系。

舉個(gè)例子來(lái)說(shuō),假設(shè)某學(xué)校在招收學(xué)生時(shí),要求學(xué)生要么學(xué)習(xí)成績(jī)好,要么體育成績(jī)好。

所有的報(bào)考學(xué)生需要參加兩門(mén)考試:文化(語(yǔ)數(shù)外),和體育(跑跳投)。最后,學(xué)校僅錄取在任一考試中考到90分以上的報(bào)考學(xué)生。

所以能夠被學(xué)校錄取的學(xué)生,要么在文化考試中考到90分以上,或者在體育考試中考到90分以上,或者在兩門(mén)考試中都考到90分以上。

現(xiàn)在如果我們分析這些被入取學(xué)生的成績(jī)分布,會(huì)發(fā)現(xiàn)一個(gè)學(xué)生的學(xué)習(xí)成績(jī),和體育成績(jī)是負(fù)相關(guān)的。因?yàn)槟切w育成績(jī)最好的學(xué)生(比如體育100分),他們的文化平均分為50分(假設(shè)他們的文化考試呈現(xiàn)正態(tài)分布)。而體育成績(jī)最差的學(xué)生(比如體育成績(jī)10分),其文化平均成績(jī)?yōu)?5分(因?yàn)橹挥谐^(guò)90分的學(xué)生才被錄?。?。

因此,分析人員可能會(huì)得出結(jié)論:體育越好,文化成績(jī)?cè)讲?。文化成?jī)?cè)胶茫w育越差。但這個(gè)結(jié)論顯然是錯(cuò)誤的。

(5)生日悖論(Birthday Paradox)

先來(lái)算一道很簡(jiǎn)單的題目:

假設(shè)你的班上一共有23位同學(xué),其中任何兩位同學(xué)生日撞期的概率為多少?

有人可能會(huì)這么想:一年有365天,把這23位同學(xué)分布在365天里,撞期的概率應(yīng)該很小。大概不到10%吧。

事實(shí)上,23位同學(xué)中,生日撞期的概率為1/2。就是說(shuō),有一半的概率,這個(gè)班上至少有一對(duì)同學(xué)的生日相同。

對(duì)于這個(gè)問(wèn)題,你可以這么考慮。我們先來(lái)算一下23位同學(xué)生日不撞期的概率。然后用1減去那個(gè)數(shù)字,就是這些同學(xué)生日撞期的概率。

假設(shè)23位同學(xué)排隊(duì)逐個(gè)進(jìn)入教室。第一個(gè)進(jìn)入教室的同學(xué),其生日和其他同學(xué)不一樣的概率為1。第二位同學(xué),其生日和其他同學(xué)不一樣的概率為364/365。第三位同學(xué),其生日和前面兩位同學(xué)生日不一樣的概率為363/365。

以此類(lèi)推,所有同學(xué)生日不撞期的概率為1 X 364/365 X 363/365 ......

然后用1減去上面的乘積,可以得出,當(dāng)教室里有23個(gè)同學(xué)時(shí),其結(jié)果為0.5左右。

總結(jié)

統(tǒng)計(jì)學(xué)是一門(mén)非常有用的學(xué)科??梢院敛豢鋸埖恼f(shuō),每一位大學(xué)生都應(yīng)該學(xué)一點(diǎn)基礎(chǔ)統(tǒng)計(jì)學(xué)。但是上面的例子也告訴我們,統(tǒng)計(jì)學(xué)中有不少陷阱。如果不了解這些誤區(qū),我們很可能會(huì)被錯(cuò)誤的統(tǒng)計(jì)方法迷惑,得出不正確的結(jié)論。

提高自己的科學(xué)知識(shí)水平,保持不斷學(xué)習(xí)的習(xí)慣,是讓自己變得更聰明的唯一途徑。

希望對(duì)大家有所幫助。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容