我們很多的判斷源于信息,而數(shù)據(jù)又是信息的精確反應(yīng)。
即使很多人認(rèn)為,數(shù)據(jù)本身并不撒謊,所以我們可以信任數(shù)據(jù)所傳遞出來的信息。殊不知,其實(shí)數(shù)據(jù)也有具有明顯的迷惑性,很容易把人誤導(dǎo)到錯(cuò)誤的結(jié)論中去。
以此次疫情期間展示的很多數(shù)據(jù)為例,來舉幾張反例,說明數(shù)據(jù)并不一定能代表事實(shí)。但這里要明確我們這里不下結(jié)論,只是就圖說話,來探尋數(shù)據(jù)與事實(shí)之間的差異。
首先,戴口罩對于抑制病毒傳播有效嗎?
下面這張圖廣為流傳,用來說明應(yīng)該鼓勵(lì)全民戴口罩來抑制病毒的傳播。
你同意它的看法嗎?

圖中將一些國家和地區(qū)分為兩類,戴口罩的不帶口罩的,數(shù)據(jù)表明那些全民戴口罩的國家和地區(qū),例如韓國、日本,新加坡,以及中國香港,疫情的發(fā)展都相對較為平緩,而那些不戴口罩的西方國家,例如美國,英國,德國,西班牙以及意大利等等,都經(jīng)歷了快速的發(fā)展。
所以這圖很容易讓人下結(jié)論說,全民戴口罩一定能抑制病情的發(fā)展。
可是,這忽略了更多的真相,例如中國屬于全民帶口罩的國家,但早期的發(fā)展與其他國家并無太大差異,歐洲有些國家也要求民眾戴口罩出門,例如捷克。
另外,韓國日本新加坡的成功抗疫經(jīng)驗(yàn)是真的因?yàn)閹Э谡謫??有沒有可能是更好的患者密切追蹤?更好的醫(yī)療體系和救治能力?更充足的檢測資源?更內(nèi)向的社交文化?民眾更好的自我應(yīng)對方案?甚至氣候?溫度?
事實(shí)背后的變量實(shí)際可能遠(yuǎn)不止帶口罩這一項(xiàng),所以我們并不能從這張圖中就得出戴口罩能抑制病毒傳播這一結(jié)論。至于真正的結(jié)論,我們有待更多的科學(xué)對比實(shí)驗(yàn)來發(fā)現(xiàn),當(dāng)然也超過了本文所討論的范疇。
類似的,如果不深入加以思考,下面這兩張圖同樣顯示了一定程度上的誤導(dǎo)性。
一張是新西蘭針對確診人員的年齡分布的統(tǒng)計(jì)。
看看這張圖,你能得到什么結(jié)論?

從圖中我們顯然可以看到確診案例中20到29歲的年輕人是占最大比例的。那么我們能從中得到病毒更偏好感染年輕人這個(gè)結(jié)論嗎?
雖然得出這個(gè)結(jié)論很誘惑,但我們也要慎重。
例如是否還很多其他未考慮的問題:
年輕人口占社會總?cè)丝诘谋壤卸嗌伲?/p>
年輕人病例多是因?yàn)樗麄兏赘心剡€是因?yàn)樗麄兊纳罘绞礁踊钴S?例如,海外的旅行更多,朋友的聚會更多,生活的圈子更復(fù)雜?接觸的人員更不確定?
這些都是背后的變量,所以我們單憑這張圖,同樣不能得到年輕人更易感的結(jié)論。
無獨(dú)有偶,美國統(tǒng)計(jì)的數(shù)據(jù)顯示,非洲裔美國人的確診和死亡數(shù)據(jù)都顯著地高于其他人種,例如在路易安娜州,僅占全州人口1/3的黑人在死亡數(shù)據(jù)上卻占到了70%:

In Illinois: 43%? of people who have died from the disease and 28% of those who have tested positive are African-Americans, a group that makes up just 15% of the state’s population.
In Michigan:account for a third of positive tests, represent 40% of deaths in that state even though they make up 14% of the population.
In Louisiana, about 70% of the people who have died are black, though only a third of that state’s population is.
那是因?yàn)?b>病毒更中意非洲裔美國人或者是黑色人種嗎?
顯然也不能下這個(gè)結(jié)論,背后的原因依然可以深究。
例如他們可能更少有健康保險(xiǎn),更多伴有其他基礎(chǔ)疾?。克麄兛赡芨嗟厥褂霉步煌??更可能生活在大密度的出租屋中?更多地從事不能遠(yuǎn)程上班的工種?
總體來說,就是更頻繁的人員接觸?
所以,綜上所述,盡管我們需要數(shù)據(jù)來支持我們做判斷,但我們也應(yīng)當(dāng)深刻理解數(shù)據(jù)背后的處理邏輯,以及事情真正的因果關(guān)系。
在分析數(shù)據(jù)時(shí),也要關(guān)心背后的取樣和統(tǒng)計(jì)方法,不能預(yù)設(shè)立場。
有時(shí)候,因?yàn)閿?shù)據(jù)而導(dǎo)致的“精確的錯(cuò)”,可能比沒有數(shù)據(jù)而依靠常識而做出的“大概的對",造成的危害更加嚴(yán)重。