第五章:我們對(duì)世界的感知是一種與現(xiàn)實(shí)相符的幻覺
??? 按照聯(lián)結(jié)學(xué)習(xí)只把事物分為“可能引發(fā)獎(jiǎng)賞”和“可能引發(fā)懲罰”兩類可不足以滿足我們對(duì)世界的體驗(yàn)(“感”)與識(shí)別(“知”)。我們要先能夠識(shí)別非條件刺激,才能做到非條件反應(yīng)。同樣,我們要先能區(qū)分各種中性刺激,才能將某種中性刺激和賞罰聯(lián)系起來。我們是怎么將刺激轉(zhuǎn)化為體驗(yàn)的?又是怎么將刺激的種類區(qū)分開的?又是怎么保證自己的感知結(jié)果是正確的?
??? 問題在于,如前文所證的那樣,心智只能意識(shí)到感知的結(jié)果,無法意識(shí)到感知過程。想要了解感知的運(yùn)作原理,只能制造出具有相似感知功能的機(jī)器進(jìn)行類比與推測(cè)。
5.1信息革命(計(jì)算機(jī)和人腦處理信息的基礎(chǔ)模式相同——通過一系列“是或否”的驗(yàn)證將信息轉(zhuǎn)化成一系列的電脈沖傳遞或電脈沖抑制以存儲(chǔ)、讀取、加工信息)
??? 第一個(gè)問題,腦在最基礎(chǔ)的層面是怎樣運(yùn)行的?
??? 對(duì)腦的解剖研究顯示:腦內(nèi)存在近千億個(gè)神經(jīng)細(xì)胞,每個(gè)神經(jīng)細(xì)胞都有多個(gè)纖維狀突出結(jié)構(gòu),每個(gè)結(jié)構(gòu)的末端都有名為“突觸”的結(jié)構(gòu),突觸緊鄰著其它神經(jīng)細(xì)胞的突觸,兩個(gè)突觸之間存在名為“突觸間隙”的縫隙。
??? 如前文所述,對(duì)腦的特定區(qū)域進(jìn)行電刺激會(huì)使被刺激者產(chǎn)生某些特定的行為和感知。電刺激可讓神經(jīng)細(xì)胞變得活躍,使其產(chǎn)生電脈沖。電脈沖會(huì)傳導(dǎo)至突觸,雖然無法通過突觸間隙,但會(huì)促使突觸釋放名為“神經(jīng)遞質(zhì)”的化學(xué)物質(zhì),激活突觸間隙對(duì)面的神經(jīng)細(xì)胞的突觸上的名為“受體”的結(jié)構(gòu)。不同神經(jīng)細(xì)胞能夠釋放的遞質(zhì)不同,每種遞質(zhì)都可以激活一種受體,受體也有多種,有些被激活的受體刺激神經(jīng)細(xì)胞產(chǎn)生電脈沖,有些抑制它產(chǎn)生電脈沖。(實(shí)際上這些敘述并不完全正確,更不完整,神經(jīng)傳導(dǎo)是非常復(fù)雜的,但簡(jiǎn)化后方便理解。)
??? 但電脈沖的傳遞和抑制這種二元變化如何使腦感知具有各種復(fù)雜特征的物體?
??? 可以參考其它靠電脈沖的傳遞和抑制運(yùn)作的物體——計(jì)算機(jī)。計(jì)算機(jī)的運(yùn)轉(zhuǎn)原理是什么呢?
??? 我們必須要稍微了解一下信息論,數(shù)字計(jì)算機(jī)的理論基礎(chǔ)之一。信息論的創(chuàng)建者克勞德·香農(nóng)(說他是信息時(shí)代的主要開創(chuàng)者之一也不為過。他不僅創(chuàng)建了大量理論,還創(chuàng)建和規(guī)范了大量定義,比如現(xiàn)代人掛在嘴邊的information。定義比理論更重要,不然我們都不知道理論里說的每個(gè)詞指的是什么。牛頓最容易被世人忽略的偉大功績(jī)就是規(guī)范了經(jīng)典物理學(xué)中的各項(xiàng)定義,讓高效地交流科學(xué)知識(shí)成為可能)將信息定義為“用來消除隨機(jī)不確定性的東西”,信息量被定義為以2為底的消除的可能性個(gè)數(shù)的對(duì)數(shù),單位定為比特,代表二進(jìn)制位。一切信息都可被替換為若干對(duì)“是或否”的可能性的消除,而獲知信息所需的驗(yàn)證“是或否”的次數(shù)的平均值即為信息量。越是難以預(yù)測(cè)的信息,包含的信息量越大。
??? 例如,去除兩張“小丑”牌后,一張撲克牌的花色有四種可能,消除這些可能性平均需要兩次檢驗(yàn),信息量就為2比特。驗(yàn)證過程例如:提問“花色是紅色嗎?”如果回答“是”,就再問“是方片嗎?”如果回答“不是”,就說明花色是紅桃。而扔硬幣只有兩種可能性,只需一次檢驗(yàn),結(jié)果的信息量為1比特。
??? 由于可以把信息的表達(dá)簡(jiǎn)化成一系列簡(jiǎn)單的“是或否”的回答,只要設(shè)計(jì)出少量用來驗(yàn)證信息的問題,計(jì)算機(jī)就可以借助有無電脈沖等二元式物理狀態(tài)改變來儲(chǔ)存、讀取和修改大量信息。
??? 而神經(jīng)細(xì)胞也只存在有、無電脈沖兩種狀態(tài),神經(jīng)遞質(zhì)和受體的差異化組合(非常復(fù)雜×2)也可以構(gòu)成驗(yàn)證問題。
??? 可以由此推測(cè),計(jì)算機(jī)和人腦處理信息的基礎(chǔ)模式相同——通過一系列“是或否”的驗(yàn)證將信息轉(zhuǎn)化成一系列的電脈沖傳遞/抑制以存儲(chǔ)、讀取、加工信息。
??? 可盡管計(jì)算機(jī)和人腦有相同的基礎(chǔ)運(yùn)作結(jié)構(gòu),也有許多相似的功能,處理相同任務(wù)的效率卻不同。例如,人腦不善于數(shù)字運(yùn)算,而電腦則很擅長(zhǎng);人腦善于識(shí)別,電腦卻不擅長(zhǎng)。說明人腦識(shí)別物體的原理必然與計(jì)算機(jī)的存在差異,差異是什么呢?
5.2信息論的問題(腦和信息論面臨同一個(gè)問題:個(gè)體要如何正確地根據(jù)接收到的信息個(gè)性化地改變對(duì)世界的認(rèn)識(shí))
??? 要弄清人腦的感知原理與電腦的差異,首先要討論信息論關(guān)心的,也是腦在識(shí)別時(shí)會(huì)面臨的兩個(gè)難題。
??? 第一,同一段訊息攜帶的信息會(huì)因?yàn)榻邮照叩南闰?yàn)知識(shí)不同而不同。
??? 信息量的計(jì)算是建立在消除“隨機(jī)不確定性”的數(shù)量之上的,而信息接收者各自都具有不同的先驗(yàn)知識(shí),所以除了搖骰子、抽紙牌這種完全隨機(jī)事件(事實(shí)上,每抽出一張紙牌,下一張紙牌的信息量就會(huì)發(fā)生變化),大多數(shù)訊息包含的隨機(jī)不確定性的數(shù)量對(duì)于每個(gè)人來說都是不同的。
??? 例如,熟悉英文的人知道一個(gè)單詞中的“Q”后面一定會(huì)跟著“U”,“quick”中的“u”沒有信息量。但對(duì)于只學(xué)過26個(gè)字母的小孩子而言,“quick”中的“q”后面有26種隨機(jī)不確定性,“u”有信息量。
??? 第二,信息的傳遞和接收可能出錯(cuò)。 這兩個(gè)問題可以合并為一個(gè):個(gè)體(無論是一個(gè)腦還是一臺(tái)計(jì)算機(jī))要如何正確地根據(jù)接收到的信息個(gè)性化地改變對(duì)世界的認(rèn)識(shí)。
???? 而就表現(xiàn)來看,腦無疑比計(jì)算機(jī)更善于處理這個(gè)問題,腦是怎么做到的?
???? 不如先看看信息論是怎么解決這個(gè)問題的。
5.3托馬斯·貝葉斯牧師(“P(A\X)=P(A)×P(X\A)/P(X)”貝葉斯定理可以精確地說明在獲知新信息X的情況下,信息接收者應(yīng)該將對(duì)A的確信程度改變多少。)
??? 先來解決問題的第一部分:同一段訊息的信息量會(huì)因?yàn)榻邮照叩南闰?yàn)知識(shí)不同而不同。
??? 如上一節(jié)所述,要計(jì)算對(duì)某個(gè)接收者而言一條訊息承載了多少信息量,需要知道接收者在接收訊息前和接收后對(duì)世界的認(rèn)識(shí)各是怎樣的,并根據(jù)認(rèn)識(shí)的改變判斷信息量。
??? 如前四章所述,心智的體驗(yàn)是腦構(gòu)建出的假象,腦對(duì)世界的感知也可能出錯(cuò),但多數(shù)情況下我們都認(rèn)為自己感知到的東西是真的。也就是說,腦或心智對(duì)世界的認(rèn)識(shí)本質(zhì)上是一種信念,是對(duì)“刺激如感知到的那樣存在”的確信程度。為了便于統(tǒng)計(jì)和計(jì)算,可以把難以量化的“認(rèn)識(shí)的改變”轉(zhuǎn)換成便于量化的“確信程度的改變”。
??? 例如,“我看到硬幣在空中旋轉(zhuǎn),然后看到硬幣落地后正面朝上/反面朝上”可以轉(zhuǎn)換為“我有50%的把握相信硬幣會(huì)正面朝上落地,在硬幣落地后我有99.99%/0.01%的信心確信硬幣正面朝上”,確信程度改變了近50%,信息量增加了約一比特。
??? 但確信程度的改變大多不這么直觀,要如何精確測(cè)量出確信程度的改變呢?
??? 借助托馬斯·貝葉斯(兩大統(tǒng)計(jì)學(xué)派之一的貝葉斯學(xué)派的奠基者,典范牧師,他研究統(tǒng)計(jì)學(xué)是為了證明上帝存在。我猜這個(gè)目的沒成功)得出的貝葉斯公式,也叫貝葉斯定理(公式的命名很有道理,貝葉斯得出的公式總不能叫拉普拉斯公式或是猜不準(zhǔn)定理):
??? P(A\X)=P(A)×P(X\A)/P(X)
?? (這是最簡(jiǎn)單的形式,貝葉斯公式的完全體是

,是在貝葉斯死后才歸納出來的。)
??? 貝葉斯公式可以精確地說明在獲知新信息X的情況下,我應(yīng)該將對(duì)事件A的確信程度改變多少。
??? 如前文所述,概率P代表我們對(duì)某事物的確信程度。P(A)是新信息X出現(xiàn)前我對(duì)事件A的先驗(yàn)信念,即我認(rèn)為事件A確實(shí)存在的概率;P(X)是我對(duì)新信息X的確信程度。對(duì)于腦來說,事件、物體等刺激和信息都是信念的一種,三者沒有區(qū)別,只是為了敘述清晰加以區(qū)分。P(X\A)是在事件A確定的前提下,將會(huì)得到新信息X的可能性;P(A\X)是在考慮新信息X后我對(duì)事件A的后驗(yàn)信念。
??? 貝葉斯定理是如何推導(dǎo)出的?
??? 假設(shè)以上四個(gè)數(shù)值已知,那么發(fā)生A事件且得到信息X的概率P(A∩X)是多少?根據(jù)我們下的定義,P(A∩X) 既等于 P(A)×P(X\A),也等于P(X)×P(A\X),也就是P(A)×P(X\A)=P(A∩X)=P(X)×P(A\X),稍微調(diào)整即可得出P(A\X)=P(A)×P(X\A)/P(X)。(貝葉斯公式的數(shù)學(xué)推導(dǎo)很簡(jiǎn)單,但是直觀上很難理解公式中的邏輯。)
??? 那么貝葉斯定理有什么用呢?
??? 例如,一座別墅在過去的20年里被盜過2次,這是先驗(yàn)概念,P(A) = 2/(20×365) = 2/7300。二次被盜后,別墅主人決定買條狗防盜,因?yàn)楫?dāng)警察的朋友告訴他,在盜賊入侵時(shí)狗九成會(huì)叫,P(X\A)=0.9,看似買狗可以防盜。據(jù)觀察,買來的狗平均夜吠概率為每周3次,這是新信息,P(X) = 3/7。問題是聽到狗叫就起床查看實(shí)在太累,把狗鏈松開又怕狗咬傷路人。為了弄清到底該不該在狗叫時(shí)起來,狗主人需要知道狗叫時(shí)真的有賊的概率P(A\X)是多少作為參考。如果是按照傳統(tǒng)的頻率學(xué)派的統(tǒng)計(jì)觀點(diǎn),必須獲得足夠大的樣本容量進(jìn)行歸納,但是賊太少了,這要怎么實(shí)際統(tǒng)計(jì)呢?(在報(bào)紙上登廣告邀請(qǐng)賊來偷以增加樣本容量這主意怎么樣?)
??? 此時(shí)貝葉斯定理就派上用場(chǎng)了:
??? P(A\X)=P(A)×P(X\A)/P(X)=(2/7300)×0.9/(3/7)≈0.00058
??? 也就是說,狗叫一萬次,有賊的次數(shù)也不會(huì)達(dá)到六次,而且狗主人無法知道是哪六次。這樣看來,養(yǎng)狗無用。
??? 但養(yǎng)狗是有用的,因?yàn)樾⊥祷旧隙紱]聽說過貝葉斯定理(“知道貝葉斯定理的人的事,能算偷么?”),他們都認(rèn)為自己一去狗九成會(huì)叫(真),一叫狗主人就會(huì)出來抓他們(偽),所以小偷會(huì)避開養(yǎng)狗的人家(偷狗賊除外)。
??? 此外,狗主人還可以借助公式提升狗叫時(shí)有賊的概率P(A\X)。他可以把狗送去寵物學(xué)校訓(xùn)練,提升分子P(X\A)的數(shù)值——讓狗變得對(duì)入侵者更加機(jī)警;降低分母P(X)的數(shù)值——讓狗學(xué)會(huì)區(qū)分,不對(duì)路人叫,只對(duì)進(jìn)入院子的人叫。
??? 除了狗叫防賊的問題,貝葉斯定理還可以在決策是否要采取措施應(yīng)對(duì)各種小概率事件時(shí)派上用場(chǎng)。此外,貝葉斯定理還有多種擴(kuò)展形式,其價(jià)值也可以進(jìn)一步擴(kuò)展。
??? 例如,統(tǒng)計(jì)顯示,到了40歲的婦女中有1%的人會(huì)患上乳腺癌,P(A)=1%,99%的人不會(huì),P(B)=99%。實(shí)驗(yàn)表明,乳腺X射線照射檢查對(duì)患乳腺癌的婦女的篩查準(zhǔn)確率為80%,P(X\A)=80%;而只有9.6%的未患乳腺癌的婦女會(huì)得到陽性檢查結(jié)果,P(X\B)=9.6%。準(zhǔn)確率有80%,誤報(bào)率只有9.6%,從直覺上看,做這種檢查明顯是有益的,應(yīng)該推廣。但是,如果所有婦女都做定期篩檢,那么檢測(cè)結(jié)果呈陽性而確實(shí)患有癌癥的比例P(A\X)究竟是多少呢?如果是按照傳統(tǒng)的頻率學(xué)派的統(tǒng)計(jì)觀點(diǎn),必須先進(jìn)行推廣找到足夠多的結(jié)果呈陽性的婦女,再挑出確實(shí)患癌的患者進(jìn)行歸納。先不說推廣花費(fèi)的人力物力的問題,以為自己得了癌癥的無病婦女受到心理沖擊該怎么辦?
??? 此時(shí)貝葉斯定理又派上用場(chǎng)了:
??? P(A\X)=P(A)×P(X\A)/P(X)
?????????????? =P(A)×P(X\A)/[P(A)×P(X\A)+P(B)×P(X\B)]
?????????????? =1%×80%/(1%×80%+99%×9.6%)≈7.8%
??? 即,在檢查結(jié)果為陽性的婦女中,超過九成的人并沒有患上乳腺癌,她們都被誤報(bào)了。而對(duì)于患癌的婦女來說,7.8%的概率并不比1%高出多少。不論患癌與否,做完這種檢查后必須再進(jìn)行其它檢查核查,這種可靠程度的篩查真的有那么大的必要推廣嗎?
??? 不過同樣可以從貝葉斯公式中看出,如果患癌率P(A)較高,比如對(duì)于有患乳腺癌家族病史的人來說患癌幾率更大,這種篩查的作用會(huì)大上許多。
??? 其實(shí)不僅是這種檢查,許多疾病篩查項(xiàng)目都有假陽性過多的問題(所以出了什么結(jié)果都先不用慌),而貝葉斯定理在公共健康領(lǐng)域發(fā)揮了巨大的作用。(貝葉斯的智慧恐怕比他的祈禱幫助到的人多得多,但促使他發(fā)揮才智的又是他的虔誠(chéng),多有趣。實(shí)際上許多科學(xué)家也是虔誠(chéng)的宗教信徒,比如牛頓,他們虔誠(chéng)地相信神的存在,但不相信教會(huì)的不合理說法。另一些科學(xué)家,像愛因斯坦,則虔誠(chéng)地相信“用理性理解世界是可能的”。像愛迪生那樣虔誠(chéng)地信仰個(gè)人名利也可以推動(dòng)科學(xué)發(fā)展。)
??? 問題的第一部分“同一段訊息的信息量會(huì)因?yàn)榻邮照叩南闰?yàn)知識(shí)不同而不同”就此解決了,貝葉斯定理可以精確地說明在獲知新信息X的情況下,我們應(yīng)該將對(duì)A的確信程度改變多少,這可以幫助我們讓決策變得更加有效。
??? 我們是可以利用貝葉斯公式解決第一個(gè)問題,但是腦是怎么解決的呢?腦也會(huì)利用貝葉斯公式在樣本容量不足時(shí)推理出后驗(yàn)信念嗎?
5.4理想的貝葉斯觀察者(腦會(huì)以最大效率利用信息,我們體驗(yàn)到世界并不是真正的、完整的現(xiàn)實(shí),而只是腦認(rèn)為的最有可能為真的那部分現(xiàn)實(shí))
??? 由貝葉斯定理可以引出“理想的貝葉斯觀察者”概念:總是以最大效率利用信息的觀察者。
??? 也就是說,每獲得一個(gè)新信息,理想的貝葉斯觀察者就會(huì)精確調(diào)整所有和這個(gè)信息密切相關(guān)的信念和對(duì)行動(dòng)的參考價(jià)值,重視高概率事件,忽視小概率事件。同時(shí),如果想要驗(yàn)證一個(gè)信念,理想的貝葉斯觀察者能通過收集最少的訊息獲得最多的信息量,從不收集沒有必要的信息。理想的貝葉斯觀察者不是永遠(yuǎn)不出錯(cuò)的先知,但他們是最高效的功利主義者。(強(qiáng)行推廣上一節(jié)中的乳腺癌檢查確實(shí)能多挽救一些人的性命或乳房,但從政府角度上看,他們必須要衡量這筆用于檢查的錢是否更應(yīng)該用來補(bǔ)助那些已經(jīng)確診的患者。)
??? 但理想往往只是理想,像上一節(jié)展示的那樣,我們,或者說心智,在思考小概率事件和龐大數(shù)目時(shí)并不擅長(zhǎng)使用新信息。(這點(diǎn)可以用我們面對(duì)彩票的態(tài)度證明,既然我們都不擔(dān)心被雷劈,為何還對(duì)發(fā)生概率更低的彩票中獎(jiǎng)有所期望呢?)
??? 沒有任何證據(jù)可以證明腦在感知過程中使用了貝葉斯定理,貝葉斯定理的意義在于心智獲得了用來判斷腦是否正確、有效地利用了信息的標(biāo)準(zhǔn)。大量證據(jù)顯示,在利用感官提供的信息時(shí),腦是一個(gè)較為理想的貝葉斯觀察者。
??? 例如,在較安靜的情況下,腦會(huì)專注于收集、處理聽覺信息,較少注意視覺信息;而在環(huán)境嘈雜時(shí),腦會(huì)比平時(shí)更為專注于收集、處理視覺信息,這些自動(dòng)調(diào)整并不需要意識(shí)的參與。
??? 如何判斷腦的決策是最為有效的呢?
??? 我們可以根據(jù)貝葉斯定理進(jìn)行檢驗(yàn):
??? 為了便于理解,我們合理假設(shè)一些熟悉的數(shù)值。腦根據(jù)大量經(jīng)驗(yàn)統(tǒng)計(jì)得出,我會(huì)把別人說的音節(jié)聽錯(cuò)的概率為1%,P(A)=1%,99%的音節(jié)不會(huì)聽錯(cuò),P(B)=99%。另外,腦還統(tǒng)計(jì)了,觀察對(duì)方口形能將80%的聽錯(cuò)的音節(jié)檢驗(yàn)出來,P(X\A)=80%;而只有9.6%的可能會(huì)判斷錯(cuò)口形,把聽對(duì)了的音節(jié)當(dāng)成聽錯(cuò)了,P(X\B)=9.6%。根據(jù)直覺判斷,準(zhǔn)確率有80%,失誤率只有9.6%,關(guān)注口形明顯是有益的,應(yīng)該時(shí)時(shí)關(guān)注口型。
??? 但腦不會(huì)犯和心智一樣的錯(cuò)誤。根據(jù)經(jīng)驗(yàn)我們也能知道,在平時(shí)的交談中,我們不太關(guān)注對(duì)方的口形變化。因?yàn)槟X清楚根據(jù)口形判斷自己聽錯(cuò)了,也確實(shí)是聽錯(cuò)了的概率:
??? P(A\X)=P(A)×P(X\A)/P(X)
?????????????? =P(A)×P(X\A)/[P(A)×P(X\A)+P(B)×P(X\B)]
?????????????? =1%×80%/(1%×80%+99%×9.6%)≈7.8%
??? 能夠利用口形糾正聽錯(cuò)的概率只有7.8%,而沒聽錯(cuò)卻用口形糾正錯(cuò)了的概率超過九成,所以平時(shí)腦很少關(guān)注口形。
??? 但是在十分嘈雜的環(huán)境中,把別人說的音節(jié)聽錯(cuò)的概率會(huì)驟增。我們假設(shè)P(A)=30%,其它的數(shù)值不受嘈雜環(huán)境的影響,此時(shí)根據(jù)口形判斷自己聽錯(cuò)了,也確實(shí)是聽錯(cuò)了的概率是多少呢?
??? P(A\X)=P(A)×P(X\A)/P(X)
?????????????? =P(A)×P(X\A)/[P(A)×P(X\A)+P(B)×P(X\B)]
???????????????=30%×80%/(30%×80%+70%×9.6%)≈78.1%
??? 能夠利用口形糾正聽錯(cuò)的概率高達(dá)78.1%,此時(shí)關(guān)注口形明顯比較有利,所以在嘈雜的情況下我們會(huì)不自覺地更加關(guān)注他人的口形。
??? 我們知道腦是根據(jù)概率感知世界,并以此為基礎(chǔ)做出決策的。如果腦是貝葉斯觀察者,腦就只會(huì)關(guān)注能極大地改變確信程度的信息,以此改變心智對(duì)現(xiàn)實(shí)的體驗(yàn)。同時(shí),腦不會(huì)花費(fèi)極多的資源去追求接近100%的預(yù)測(cè)準(zhǔn)確率,腦會(huì)忽視對(duì)確信程度影響極小的信息并無視了與攜帶這部分信息的現(xiàn)實(shí)。
??? 在第一到三章中已經(jīng)證明了我們體驗(yàn)到世界并不是真正的、完整的現(xiàn)實(shí),而此刻我們可以細(xì)化心智體驗(yàn)的內(nèi)容——腦認(rèn)為最有可能為真的那部分現(xiàn)實(shí)。
(未完待續(xù))
點(diǎn)擊就送......其它章的讀書總結(jié)
那么絮叨版和純凈版的區(qū)別何在呢?
絮叨版里有括號(hào)里的斜體字內(nèi)容,純凈版里則沒有。
為什么要有兩個(gè)版本?要是當(dāng)初羅慕路斯和勒莫斯能夠建像斯巴達(dá)人立兩位王那樣把權(quán)力分成兩份,就不會(huì)出現(xiàn)手足相殘的悲劇了,所以把東西分成兩份還是很有必要的。
怎么辦,這破理由我自己都說服不了自己...