
1、“小樣本謬誤”與“大數(shù)據(jù)時(shí)代”
很多時(shí)候,我們?cè)谕ㄟ^(guò)某項(xiàng)測(cè)驗(yàn)來(lái)驗(yàn)證某個(gè)問(wèn)題的時(shí)候,一個(gè)很容易犯的錯(cuò)誤就是“選取了過(guò)少的樣本”。這一方面是因?yàn)橛袝r(shí)完備的樣本很難得到,另一方面則是因?yàn)槲覀冞^(guò)于相信直覺(jué),總覺(jué)得自己的判斷是正確的,選取樣本的行為不過(guò)是例行公事。但實(shí)際上,過(guò)小的樣本會(huì)讓假說(shuō)不能被證實(shí)的概率上升至50%。
不過(guò)現(xiàn)在這一問(wèn)題應(yīng)該可以被解決了。美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究所(NIST)在2005展開了一項(xiàng)“機(jī)器翻譯”的測(cè)評(píng),之前從沒(méi)做過(guò)機(jī)器翻譯的 Google 以 5% 以上的優(yōu)勢(shì)毫無(wú)爭(zhēng)議地領(lǐng)先了南加州大學(xué)、IBM沃森實(shí)驗(yàn)室等傳統(tǒng)豪強(qiáng),令所有人大吃一驚。剛開始都以為是技術(shù)的優(yōu)勢(shì),后來(lái)才發(fā)現(xiàn),相比于其他團(tuán)隊(duì),Google 唯一的優(yōu)勢(shì)就是數(shù)據(jù)量夠大。大即不同,也許大數(shù)據(jù)技術(shù)的持續(xù)進(jìn)步,會(huì)進(jìn)一步降低“小樣本謬誤”的發(fā)生概率。
2、信任多于質(zhì)疑
對(duì)于每個(gè)人而言,對(duì)于某個(gè)信息,第一反應(yīng)就是選擇相信,尤其是在熟悉的場(chǎng)景下。
這也沒(méi)有什么特殊的原因,相比于信任,我們的大腦并不擅長(zhǎng)質(zhì)疑。我們有一種不由自主將信息處理得盡可能連貫的天賦,以證實(shí)我們的猜想。而一旦有蛛絲馬跡的證據(jù)能夠證實(shí)我們的猜想,我們就會(huì)更加投入地信任,以證明自己的判斷是對(duì)的。
這也是為什么朋友圈里經(jīng)常會(huì)有一些漏洞百出、卻刷屏的文章的原因了吧?
3、為隨機(jī)事件找原因
我住的那個(gè)小鎮(zhèn)有一個(gè)彩票店,每天晚上那里都會(huì)圍著一群人在討論什么。討論什么呢?討論彩票的走勢(shì)圖,這群彩友總是會(huì)費(fèi)盡心機(jī)地研究前一段時(shí)間的中彩號(hào)碼,然后得出一個(gè)新的號(hào)碼下注,樂(lè)此不疲。
我當(dāng)時(shí)上初中,雖然年紀(jì)小,但是似乎也覺(jué)得這種事沒(méi)啥前途。后來(lái)學(xué)了概率,才知道買彩票這種事情屬于“隨機(jī)事件”,而任何兩次“彩票中獎(jiǎng)”都是相對(duì)獨(dú)立的小概率事件,研究趨勢(shì)圖當(dāng)然沒(méi)什么卵用。
但是我還是理解他們想要去分析彩票規(guī)律的這個(gè)心理。畢竟,我們都非常愿意相信生活中大部分事情并不是隨機(jī)的,其實(shí)真實(shí)情況往往相反——這是一個(gè)隨機(jī)性遍布的世界。