統(tǒng)計,以信仰之名:(二)統(tǒng)計學(xué)——科學(xué)的邏輯
E.T.Jaynes所著的《概率論沉思錄》自出版以來廣受好評。然而這本厚達700余頁的書所講述的確并非概率論,而是統(tǒng)計。它的英文名字實際是”Probability Theory, The Logic of Science”,翻譯過來就是“概率論——科學(xué)的邏輯”。嚴(yán)格來講,統(tǒng)計的是不嚴(yán)謹(jǐn)?shù)?,很多東西我們無法根據(jù)公理推出,但是它符合我們的常識,就像物理基本定律一樣。從某種角度講,統(tǒng)計更類似于一種信仰。下面我們看看這種“信仰”是如何產(chǎn)生的。
假設(shè)我約你賭錢,規(guī)則是投均勻硬幣,正面你贏100塊錢,反面我贏100塊錢。投了100次,100次全是反面,那么此時你已經(jīng)傾家蕩產(chǎn)了。比起接下來幾年泡面度日,你更可能質(zhì)疑我是否在“出老千”。這時要做的就是假設(shè)檢驗:再投100次,如果還是全是反面,那么就說明我在“出老千”。然而,均勻硬幣出現(xiàn)這種情況可不可能呢?是可能的,只不過概率很小。你可能就是個喝水都塞牙的倒霉蛋。但是在現(xiàn)實中,我們所能想出的最好的方法也不過如此了。所以古典統(tǒng)計的邏輯簡單來說就是“相信自己不是一個倒霉蛋”。
曾經(jīng)哆嗒數(shù)學(xué)網(wǎng)上有這樣一個問題,大意如下:
已知隨機變量Xi, i=1,2,...,10服從形式為N(μ,10)的正態(tài)分布,要對是否有μ=0進行假設(shè)檢驗。
通常的步驟是,我們算出Xi均值X,它服從N(μ,1)。該均值只有5%的概率落在[-2,2]外。所以,如果這個均值落在了[-2,2],那么我們接受μ=0,如果它落在[-2,2]外面,我們堅信自己不會這么倒霉,所以我們認為μ≠0。
那個問題是,均值落在[-0.01,0.01]之內(nèi)的概率也很小,為什么不選則落在[-0.01,0.01]時拒絕μ=0呢?其實他這么說在邏輯上沒有錯誤,然而并沒有什么卵用,因為我們不關(guān)心它是否在[-0.01,0.01]。假如我們還是在賭博,當(dāng)然我們希望進行的是一場公平的賭博。我們?nèi)右粋€同分布的Χ0出來,然后我付給你Χ0萬元。如果均值是[-0.01,0.01]并沒有什么問題,但是如果均值落在[-2,2]外,我們就得好好談?wù)劻恕?/p>
這里注明一下,選什么區(qū)間也不是絕對的,要根據(jù)問題而定。有時候還就得選[-0.01,0.01]作為拒絕域。
總結(jié):與概率論不同,統(tǒng)計強烈依賴于你相信什么 與 關(guān)心什么。從這一點上講,統(tǒng)計與信仰沒什么不同。