夏天終于到了!
一年一度的五一勞動節(jié),標志著夏季的到來,這幾日的炎炎烈日正是太陽親切的問候。在經(jīng)歷了艱辛和堅持后,社會生活秩序漸漸恢復。正如肖恩也回到了學校,準備畢業(yè),然后步入社會。在社會重回正軌之際,看著海外嚴峻的疫情形勢,我們不禁要問,這新冠疫情何時是個頭?我們面前的口罩幾時能脫下?
2003年,SARS席卷我國時,在夏季突然銷聲匿跡。于是我們期待著,COVID-19也能像SARS一樣,被炎熱逼退。但是
- SARS的離開真的是因為炎熱嗎?
- 如果SARS不耐熱,那么COVID-19也不耐熱嗎?
新冠肺炎是否耐熱,是否會在夏季消失或者減弱,這里面有許多的問題需要回答。而目前我們知道的還是太少了。我們可以給出概率統(tǒng)計, 但所有的概率統(tǒng)計,都是基于已知信息的最可能估計,不代表事件實際發(fā)生的可能性大小。
時至今日,疫情已在全球范圍內(nèi)肆虐了近3個月,縱觀世界疫情整體情況,戰(zhàn)斗沒有停止,且在某些地方愈戰(zhàn)愈烈。在中國,疫情并沒有離開過,現(xiàn)在的它,只是去了別的地方,并試圖返回中國。 今天我們再來做一些分析,看看疫情影響疫情的關鍵因素。本人能力有限,歡迎看客前來指正和建議。
數(shù)據(jù)獲取
- 最最原始的數(shù)據(jù)是丁香園的
- 我這里使用的是github上別人爬取的數(shù)據(jù),BlankerL/DXY-COVID-19-Data(2020-05-02,我發(fā)現(xiàn)丁香園和騰訊的數(shù)據(jù)某些國家上有較大的出入)
病死率的走勢
一個國家的確診人數(shù),是由許許多多因素共同作用的結(jié)果,比如國家的政策,民眾意識,民族文化,防護措施,病毒在該地的適應性(氣溫等);這里面我認為國家的防疫措施最為關鍵,比如嚴格的隔離政策和經(jīng)濟穩(wěn)定措施。而一個國家的病死率,可能更多的體現(xiàn)在醫(yī)療水平上和醫(yī)療物資水平。然而,許多發(fā)達國家,醫(yī)療水平近似,死亡率卻相差很大,有些國家病死率約為5%,而有些國家病死率接近15%。
我們先來看一下幾個疫情重災區(qū)的病死率走勢:

確診人數(shù)與病死率
上圖中,幾乎所有的國家的病死率都是日益增加的,這可能和不斷新增的確診人數(shù)有關。當確診人數(shù)達到當?shù)蒯t(yī)療系統(tǒng)的上限時,醫(yī)療系統(tǒng)必定會陷入幾近癱瘓的狀態(tài),物資告急,醫(yī)務人員短缺,病床不夠等等,不僅會大大降低院內(nèi)病人的治愈率,更可悲的是大多數(shù)人可能一診難求,病死家中。病人的病死率隨著確診人數(shù)的增加而增大。
那么病死率和確診人數(shù)又有怎么樣的關系?
為了讓數(shù)據(jù)更有統(tǒng)計意義,我這里只統(tǒng)計目前累計確診人數(shù)達到1000的國家或地區(qū)。這里我們不統(tǒng)計具體人數(shù)和病死率,只統(tǒng)計排行RANK。下圖,是確診人數(shù)排行和死亡率排行的連線圖,左側(cè)為確診人數(shù)排行,右側(cè)為死亡率排行。我們來看看哪些國家較好的控制了病死率,而哪些國家失控了。

這是確診人數(shù)排行和死亡率排行之差的頻數(shù)統(tǒng)計

我們可以看到:
- 整體上看,高確診人數(shù)的國家對應著較高的死亡率,低確診人數(shù)的國家對應著較低的死亡率(大多數(shù)的線接近水平,斜率不大,頻數(shù)大多數(shù)在0附近)
- 我們也可以在第一張圖明顯地觀察到一個類似于“X”的圖形
- X的中斜向下的國家,這些國家有著較高的總確診病例數(shù),但是其死亡率排行卻不高,說明了他們有較好的治療效果,控制住了病死率。我們將這些國家稱為低病死率國家
- X的中斜向上的國家,他們總確診人數(shù)不高,但是死亡率卻較高,看來是醫(yī)治不利。我們將這些國家稱為高病死率國家。
這里的低病死率和高病死率,不是病死率的絕對值高或低,而是相對于確診人數(shù)排行來確定的。
高/低病死率國家有什么規(guī)律嗎?
如果我們可以找到高低病死率國家的一些通性,就可以預測一些高危地區(qū),可能會對疫情的防控有所幫助。比如高低病死率是否和溫度有關,是否和醫(yī)療條件有關等等。
我們先看看高低病死率國家分別有哪些?
低病死率 : ['德國', '俄羅斯', '土耳其', '秘魯', '印度', '葡萄牙', '沙特阿拉伯', '新加坡', '巴基斯坦', '智利','以色列', '白俄羅斯', '卡塔爾', '阿聯(lián)酋', '烏克蘭', '韓國', '塞爾維亞', '孟加拉國', '澳大利亞', '科威特', '哈薩克斯坦', '巴林', '阿曼']
高病死率 :['印度尼西亞', '菲律賓', '埃及', '芬蘭', '阿根廷', '阿爾及利亞', '匈牙利', '希臘', '尼日利亞', '伊拉克', '克羅地亞', '喀麥隆', '波黑', '愛沙尼亞', '保加利亞', '波多黎各', '古巴', '北馬其頓', '立陶宛', '斯洛文尼亞', '斯洛伐克', '新西蘭', '玻利維亞']
把他們畫在地圖上 是這樣的:

藍色:低病死率國家, 橙色:高病死率國家,綠色為目前無感染的國家(綠色部分由于國家名稱不匹配問題,可能并不完全正確)
高溫能抑制疫情嗎
從這張圖,我們其實也能看到一些信息,高低病死率和溫度是沒有關系的。我們能看到,高病死率或者低病死率都在低/中/高緯度有所分布。無感染國家也無明顯緯度分布特點。
為了更直接驗證溫度是否影響病毒的傳播,我又統(tǒng)計了最近一周各國出現(xiàn)的新增確診病例數(shù),看近一周的新增病例分布與緯度是否有關聯(lián)。
但像美國和俄羅斯這樣的大國,因為國家大,人數(shù)多,所以總確診人數(shù)多,所以為了去除國家面積這個bias,我嘗試使用確診人數(shù)除以總國土面積(其實貌似除以總?cè)丝谝部梢裕?,在一定程度上補償國家大小帶來的偏差,但在國土面積較小時,很不穩(wěn)定,所以改用周確診人數(shù)除以log2(國土面積),結(jié)果再取log作圖:

呈現(xiàn)在地圖上:

從上圖,也能看到周新增較多的國家,大多數(shù)是人口大國和歐洲國家,在維度上,并沒有什么明顯趨勢。反而像新加坡,多米尼加這樣的低緯度國家疫情發(fā)展迅速。
經(jīng)濟水平對疫情防治的幫助
最后,我們來看一下,不同國家經(jīng)濟水平是否對疫情的治療有影響。這里統(tǒng)計了高/低病死率國家的人均GDP(GDP per capita),通過可視化和T-test假設檢驗來統(tǒng)計高/低病死率國家在經(jīng)濟水平上是否有顯著差異。
可視化為SwarmPlot + Boxplot,可見低病死率的國家整體上擁有較高的人均GDP。

使用T-test檢驗顯著性,t=-2.27, p = 0.028,具有統(tǒng)計學意義。較好的經(jīng)濟水平確實與控制病死率相關。
結(jié)語
疫情的傳播的防控需要國家的嚴格措施,而疫情的病死率需要足夠的經(jīng)濟和科技力量去控制,然而如果確診人數(shù)居高不下,無論多強大的經(jīng)濟和醫(yī)療水平都可能顯得無力。在疫情面前,防控 >> 治療。如今,我們能開學,能開心地和父母通話,都需要感謝國家的力量。
而我們需要謹記的是,疫情仍未離去,既然高溫殺不死它,那么什么可以呢?可能明年的疫苗,也可能是全球人民眾志成城隔離的決心,抑或某種藥物。無論如何,我們都知道這將是漫長的戰(zhàn)斗,我們不知道何時能戰(zhàn)勝它,一年兩年三年四年,前路艱辛,但我們堅信勝利。全球有無數(shù)的醫(yī)護人員在努力和犧牲,無數(shù)的科研人員在追趕時間,無數(shù)的警察、安保在嚴格排查,更是有數(shù)不清的你我他在疫情期間自我隔離。我相信團結(jié)的力量,不會讓大家的努力付之一炬。
最后,地球是個村,村子越來越小,雞犬相聞,老死不相往來的日子已經(jīng)過去。在面對這類全球的公共衛(wèi)生危機時,沒有人可以置身事外。新冠縱然非我們所愿,也是一次警鐘。如何面對全球災難,是所有村民需要思考的問題。
2020-05-03