在COVID-19(新型冠狀病毒肺炎)疫情的背景下,人們接觸到更多的統(tǒng)計(jì)學(xué)名詞:空白對(duì)照組、設(shè)計(jì)雙盲隨機(jī)對(duì)照試驗(yàn)、核酸檢測陽性率、提高治愈率,降低病亡率等。例如鐘南山院士在介紹廣醫(yī)防疫經(jīng)驗(yàn)時(shí)就提到了空白對(duì)照和雙盲隨機(jī)對(duì)照。
大敵當(dāng)前,坦白說,你敢用空白對(duì)照嗎?如果他發(fā)展得很重怎么辦?
在治療第一、科研第二的情況下,我們怎么能設(shè)計(jì)雙盲隨機(jī)對(duì)照?不可能。
中國在抗擊新冠疫情中的謹(jǐn)慎,不僅體現(xiàn)在臨床試驗(yàn)的方案設(shè)計(jì)上,而且在多版《新型冠狀病毒肺炎診療方案》中對(duì)用藥的劑量都有明確的規(guī)定。現(xiàn)代藥物對(duì)人體功能的影響似乎是非常精確的,一毫克或兩毫克的劑量就可以引起血壓或神經(jīng)的巨大變化。
不過,藥理學(xué)研究已經(jīng)證明,這些影響因素是用概率分布理論設(shè)計(jì)和分析的,它們實(shí)際上是概率分布的參數(shù)。統(tǒng)計(jì)的基本思想在于,科學(xué)研究的真實(shí)對(duì)象是數(shù)據(jù)的概率分布。
統(tǒng)計(jì)學(xué)名詞對(duì)于我們來說或許有點(diǎn)陌生,但是當(dāng)人們解決問題沒有十足的把握時(shí),一般都會(huì)用概率進(jìn)行表達(dá)。當(dāng)我們運(yùn)用概率的時(shí)候,一般就是人類承認(rèn)自己的無知。
概率僅僅是我們無知程度的度量。 -- 亨利·龐加萊
我們認(rèn)識(shí)的所有的「確定性」是「不確定性」,概率是對(duì)「不確定性」的測度。人們花了很大的精力用于讓人們理解概率,試圖將概率的數(shù)學(xué)思想與現(xiàn)實(shí)生活聯(lián)系起來。
那么,人們真的理解概率嗎?
概率在現(xiàn)實(shí)生活中意味著什么?這也是柯爾莫哥洛夫最后的問題。
01 數(shù)據(jù)
北京時(shí)間2020年4月24日凌晨,WHO(世界衛(wèi)生組織)官網(wǎng)發(fā)布了瑞德西韋治療重癥COVID-19的臨床試驗(yàn)研究結(jié)果。
數(shù)據(jù)顯示,這項(xiàng)瑞德西韋治療重癥COVID-19的臨床試驗(yàn)原計(jì)劃入組453例,實(shí)際入組237例,其中瑞德西韋治療組158例,標(biāo)準(zhǔn)治療對(duì)照組79例,死亡率分別為13.9%和12.8%,無統(tǒng)計(jì)學(xué)差異。結(jié)果認(rèn)為,瑞德西韋治療未明顯改善COVID-19重癥患者臨床癥狀。
該研究團(tuán)隊(duì)隨即在官網(wǎng)上發(fā)布聲明,表示此項(xiàng)試驗(yàn)由于入組率過低而提前終止,其結(jié)果很難具有統(tǒng)計(jì)學(xué)意義。隨后WHO發(fā)言人稱無意間發(fā)布了研究團(tuán)隊(duì)提供的初稿,在意識(shí)到失誤后隨即撤下。
北京時(shí)間2020年4月30日,王辰院士以及曹彬教授所領(lǐng)銜的科研團(tuán)隊(duì)于The Lancet發(fā)表題為《Remdesivir in adults with severe COVID-19: a randomised, double-blind, placebo-controlled, multicentre trial 》的研究,評(píng)估了瑞德西韋用于出現(xiàn)較嚴(yán)重臨床癥狀的新冠肺炎確診病患的療效,根據(jù)論文得出的結(jié)論,與安慰劑組相比,通過瑞德西韋治療并不能加快 COVID-19 患者的恢復(fù)速度,也不能減少 COVID-19 患者的死亡。
02 模型
對(duì)于被WHO泄露的實(shí)驗(yàn)設(shè)計(jì)中,不同的治療方法是隨機(jī)分配給患者的。實(shí)驗(yàn)啟動(dòng)后觀察結(jié)果,假設(shè)兩種療法具有相同的效果。由于患者和療法的匹配是隨機(jī)的,因此任何其他分配方式都會(huì)得到類似的結(jié)果。
隨機(jī)的療法標(biāo)簽對(duì)結(jié)果沒有影響,可以在患者之間調(diào)換——前提是兩種療法具有相同的效果。因此,該試驗(yàn)的事件空間就是可以實(shí)現(xiàn)的所有可能隨機(jī)分配方式的集合。
瑞德西韋治療組和標(biāo)準(zhǔn)治療對(duì)照組的顯著性檢驗(yàn),屬于兩個(gè)樣本率差異的顯著性檢驗(yàn),根據(jù)提供的數(shù)據(jù)可以得出該假設(shè)檢驗(yàn)的原假設(shè)H0和備擇假設(shè)H1:
H0:瑞德西韋治療組和標(biāo)準(zhǔn)治療對(duì)照組的死亡率無顯著性差異。
H1:瑞德西韋治療組和標(biāo)準(zhǔn)治療對(duì)照組的死亡率有顯著性差異。
根據(jù)被WHO泄露的數(shù)據(jù)構(gòu)造統(tǒng)計(jì)量并進(jìn)行P值的計(jì)算,P-Value>顯著性水平(α=0.05),接受原假設(shè),即認(rèn)為瑞德西韋治療未明顯改善COVID-19重癥患者臨床癥狀。
假如這項(xiàng)臨床試驗(yàn)的統(tǒng)計(jì)分析顯示,瑞德西韋治療組和標(biāo)準(zhǔn)治療對(duì)照組的療法之間存在顯著性差異。這是否意味著醫(yī)學(xué)界可以肯定瑞德西韋療法能夠治療新的COVID-19重癥患者?這是否意味著它適用于一定比例的COVID-19重癥患者?它是否僅僅意味著瑞德西韋療法僅僅對(duì)于研究中選擇的這一部分人群更加有效?
統(tǒng)計(jì)學(xué)的顯著性檢驗(yàn)只能與隨機(jī)化實(shí)驗(yàn)共同使用。要想將概率應(yīng)用到現(xiàn)實(shí)生活中時(shí),必須確定計(jì)算這些概率所依據(jù)的事件空間。
在抽樣調(diào)查領(lǐng)域,概率在現(xiàn)實(shí)生活中的含義是非常明確的。
當(dāng)統(tǒng)計(jì)方法被用于天文學(xué)、社會(huì)學(xué)、流行病學(xué)、法律或者天氣預(yù)報(bào)等觀測性研究時(shí),這一含義就沒有那么明確了。因?yàn)椴荒艽_定所計(jì)算的概念的事件空間,就無法證明一個(gè)模型比另一個(gè)模型更加合理,因此這些領(lǐng)域常常出現(xiàn)爭議。
03? 洞察
現(xiàn)實(shí)非常復(fù)雜,充滿了各種意外、混亂和轟動(dòng)性事件。人們構(gòu)造的科學(xué)模型永遠(yuǎn)無法完整地描述現(xiàn)實(shí)。科學(xué)革命必然經(jīng)歷一個(gè)模型更替的過程。
首先,科學(xué)家往往會(huì)提出一個(gè)現(xiàn)實(shí)模型,這個(gè)模型看上去符合現(xiàn)有數(shù)據(jù),而且完全可以用于預(yù)測試驗(yàn)結(jié)果。
然后,隨著數(shù)據(jù)的積累,對(duì)模型做出修改以滿足新的發(fā)現(xiàn),于是模型越來越復(fù)雜,增加了對(duì)特殊情況的處理和看上去不成立的擴(kuò)展。
最終,模型變得不再適合實(shí)際使用。此時(shí),具有創(chuàng)造性的思想家會(huì)提出一個(gè)完全不同的模型,引發(fā)一場科學(xué)革命。
統(tǒng)計(jì)革命就是這種模型更替的一場連環(huán)顛覆的思想盛宴。
決定論哲學(xué)掌控了19世紀(jì)早期的科學(xué),人們相信一切事情的發(fā)生都是由宇宙初始條件和描述運(yùn)動(dòng)的數(shù)學(xué)公式?jīng)Q定的。
19世紀(jì)末期,人們發(fā)現(xiàn),牛頓和拉普拉斯使用過的定律只是一種粗略的估計(jì),科學(xué)逐漸使用一種新的模式,即現(xiàn)實(shí)的統(tǒng)計(jì)模型。到了20世紀(jì)末,幾乎所有學(xué)科都轉(zhuǎn)移到了使用統(tǒng)計(jì)模型的陣營。
大眾文化沒有跟上這種科學(xué)的腳步,有些模糊的概念和表述(如“相關(guān)性”、“概率”、“風(fēng)險(xiǎn)”)成為了大眾詞匯,大多數(shù)人也知道了一些科學(xué)領(lǐng)域上的不確定性。不過大多數(shù)人并沒有意識(shí)到哲學(xué)觀念已經(jīng)發(fā)生了深刻轉(zhuǎn)變。
科學(xué)研究的對(duì)象不是可以觀察到的事物,而是描述觀測值概率的數(shù)學(xué)分布函數(shù)。
當(dāng)我們進(jìn)入21世紀(jì),統(tǒng)計(jì)思想幾乎在所有學(xué)科中完全擊敗了決定論。但是,我們可以想象的到,統(tǒng)計(jì)革命最終也將走到盡頭,被另一種體系取代。
僅憑人類智慧不可能組織出一個(gè)能夠近似描述真實(shí)客觀世界的思想體系。任何此種嘗試都將具有本質(zhì)上的錯(cuò)誤。
到最后,這些錯(cuò)誤將會(huì)變得越來越明顯,人們只能不斷修改科學(xué)模型并最終將其拋棄,選擇另一個(gè)更加精妙的模型。
當(dāng)人們在現(xiàn)實(shí)生活中尋找概率的意義時(shí),通常會(huì)去尋找柯爾莫哥洛夫抽象概率空間的實(shí)際意義。
柯爾莫哥洛夫卻選擇了另一種方法,將他的概率公理以及解決數(shù)學(xué)問題的方法徹底推翻,他認(rèn)為信息論不是概率計(jì)算的結(jié)果,而是概率的起源……
也許有一個(gè)人,會(huì)接過柯爾莫哥洛夫留下的火把,開創(chuàng)一種以數(shù)字計(jì)算機(jī)的本質(zhì)為哲學(xué)基礎(chǔ)的分布理論。
也許在某個(gè)地方,另一位?R. A. Fisher?已經(jīng)出現(xiàn)在當(dāng)今科學(xué)的前沿領(lǐng)域,他很快就會(huì)以人們從未想過的見解和觀點(diǎn),給世界帶來巨大的驚喜。