一、看不見(jiàn)的薩摩耶
家附近曾經(jīng)有只白色的薩摩耶,大約十二歲,挺安靜溫順的,基本不怎么吠叫。聽(tīng)說(shuō)主人身體不好,有人癱瘓?jiān)诩?,于是就放任其在外亂逛。他雖然個(gè)頭不小,馬路什么都過(guò)的好好的。可今年某天他過(guò)人行橫道的時(shí)候,一輛左轉(zhuǎn)的車(chē)輛速度和它過(guò)馬路的速度一致,導(dǎo)致它進(jìn)入了駕駛員的A柱盲區(qū)。等薩摩耶反應(yīng)過(guò)來(lái)時(shí),車(chē)已經(jīng)對(duì)著它沖了過(guò)來(lái),左前輪壓了一次,左后輪又壓了一次……它躺在車(chē)后,無(wú)助地顫抖著、哀嚎著。兩旁的行人呆呆地看著,我也是……車(chē)主坐在車(chē)?yán)?,沒(méi)開(kāi)窗沒(méi)下車(chē),不知道是何反應(yīng)。過(guò)了一會(huì),狗用力翻身站了起來(lái),搖搖晃晃走起來(lái)了,準(zhǔn)備回家。大家松了一口氣,有人笑著說(shuō)狗沒(méi)事了。車(chē)主也順便一溜煙開(kāi)車(chē)跑了。可是,狗沒(méi)走到200米,便慢了下來(lái),實(shí)在是走不動(dòng)了。它的左眼珠早已被汽車(chē)壓得爆了出來(lái),滿(mǎn)嘴的鮮血……于是,它便安靜地躺在人行道上,還像平日逛街一樣,一聲不吭……希望它下輩子,不要走得這么悲慘。
作為智能體,人的視覺(jué)和現(xiàn)在的機(jī)器視覺(jué)是有區(qū)別的。其中一個(gè)非常特別的區(qū)別是,人會(huì)根據(jù)情況或上下文有意無(wú)意地忽略眼中看到的目標(biāo)。
1999年兩位權(quán)威心理學(xué)專(zhuān)家克里斯托弗·查布里斯(Christopher F.Chabris)和丹尼爾·西蒙斯(Daniel J.Simons)曾做過(guò)一次“看不見(jiàn)的大猩猩”的實(shí)驗(yàn)。
兩個(gè)人在攝像機(jī)前表演玩牌的魔術(shù)。表演的過(guò)程中,身上的衣服、背景、桌布都被換掉了。但由于攝像機(jī)關(guān)注焦點(diǎn)的變化,觀測(cè)者只注意了兩位“魔術(shù)師”手中撲克牌的變化,而視頻中已經(jīng)換掉的材料卻壓根就沒(méi)發(fā)現(xiàn)。
如果讓計(jì)算機(jī)或利用人工智能算法來(lái)跟蹤并區(qū)分變化內(nèi)容,會(huì)很快發(fā)現(xiàn)其中的區(qū)別。因?yàn)橛?jì)算機(jī)在檢測(cè)目標(biāo)時(shí),會(huì)考慮像素位置上的強(qiáng)度變化。所以,當(dāng)視頻中出現(xiàn)大猩猩,或者變換桌布、背景、衣服時(shí),都意味著視頻幀與幀之間出現(xiàn)了大面積的像素變化。這種變化,很容易超過(guò)圖像變化程度的閾值, 導(dǎo)致被檢測(cè)和發(fā)現(xiàn)。值得指出的是,檢測(cè)這類(lèi)變化也是現(xiàn)在做視頻摘要、視頻關(guān)鍵內(nèi)容提取的基本手段之一。
反觀人類(lèi),人卻容易出現(xiàn)忽略目標(biāo)的情況。其原因在于,當(dāng)人關(guān)注某個(gè)目標(biāo)時(shí),目標(biāo)將成像于視網(wǎng)膜的焦點(diǎn)即中央凹區(qū)域,而目標(biāo)周?chē)膬?nèi)容則分布在中央凹的周邊,由視桿細(xì)胞來(lái)負(fù)責(zé)感知。而視桿細(xì)胞主要負(fù)責(zé)運(yùn)動(dòng),對(duì)具體細(xì)節(jié)不敏感,所以,大猩猩在這一前提下就被大腦視覺(jué)中樞視為沒(méi)有多大意義的像素點(diǎn)運(yùn)動(dòng),甚至被籃球的運(yùn)動(dòng)所掩蓋。換衣服、桌布等也是類(lèi)似的原因。
除此以外,也許是因?yàn)槿祟?lèi)其實(shí)是一種能偷懶就會(huì)偷懶的智能體。如果能夠在不經(jīng)過(guò)縝密思維就能保證大部分判斷成功的話(huà),人類(lèi)會(huì)傾向于優(yōu)先采用更簡(jiǎn)易的判斷,而不是進(jìn)行過(guò)多的細(xì)致分析。就像平時(shí)走路一樣,我們也沒(méi)有像機(jī)器人一樣去區(qū)分路面的高低差異、紋理差異、光強(qiáng)差異,但卻能非常有效和快速的形成決策。即使存在例外,那也是極個(gè)別的情況。
這種現(xiàn)象,在日常生活中,是比較危險(xiǎn)的。比如交通中,在一個(gè)平時(shí)很少有人經(jīng)過(guò)的十字路口,駕駛員的關(guān)注焦點(diǎn)將是行駛的汽車(chē),其關(guān)注點(diǎn)以避讓汽車(chē)為主。在成年人經(jīng)常走過(guò)的人行橫道附近,則駕駛員的關(guān)注視角會(huì)以成人為主。前者的情況會(huì)導(dǎo)致,某天突然出現(xiàn)非機(jī)動(dòng)車(chē)或行人時(shí),司機(jī)會(huì)注意不到,不容易形成應(yīng)急反應(yīng);后者則可能會(huì)忽略對(duì)矮小目標(biāo)的關(guān)注。
能避免嗎?有心理學(xué)家指出,如果關(guān)注的焦點(diǎn)不變,這種定式思維會(huì)一直存在,且很難避免。結(jié)果,當(dāng)駕駛員發(fā)現(xiàn)危險(xiǎn)來(lái)臨時(shí),已經(jīng)缺乏足夠的反應(yīng)時(shí)間,極易形成交通事故 。
那如何解決呢?最簡(jiǎn)單的辦法就是不要在經(jīng)常經(jīng)過(guò)的這些路口形成定式思維。但凡碰到這類(lèi)路線(xiàn)時(shí),不妨想想,這里可能有條看不見(jiàn)的薩摩耶。不妨多變化下關(guān)注的視野,如轉(zhuǎn)下頭、變換下關(guān)注的視野,最大程度地避免這類(lèi)事故的發(fā)生。
二、看不見(jiàn)的盲點(diǎn)
人的視覺(jué)不僅有視而不見(jiàn)的特點(diǎn),也有彌補(bǔ)先天不足的能力。我們的視神經(jīng)感受周?chē)h(huán)境后,還需要將信號(hào)送到大腦。送的方式挺聰明,大腦將輸送信號(hào)的神經(jīng)元像頭發(fā)一樣扎成一股,左邊一股,右邊一股,在每個(gè)眼球視網(wǎng)膜中央凹偏外約20度處集中起來(lái),向大腦輸送信號(hào)。于是,這個(gè)位置就沒(méi)有感光細(xì)胞,形成了生理性盲點(diǎn),如圖1所示。
圖1:人眼構(gòu)造,視神經(jīng)傳輸位置沒(méi)有感光細(xì)胞
圖2: 生理性盲點(diǎn)測(cè)試圖
要檢測(cè)盲點(diǎn)的具體位置,不妨試試圖2這個(gè)經(jīng)典的盲點(diǎn)測(cè)試圖。首先,捂住左眼,用右眼盯著圖上的圓點(diǎn),將手機(jī)逐漸拉遠(yuǎn)或拉近,會(huì)發(fā)現(xiàn)在某個(gè)位置時(shí)十字會(huì)消失。這個(gè)位置,對(duì)應(yīng)于你的右眼盲點(diǎn)。類(lèi)似的,捂住右眼,用左眼盯著右邊的十字形,移動(dòng)手機(jī)遠(yuǎn)近,會(huì)發(fā)現(xiàn)圓點(diǎn)在某個(gè)位置消失了。它對(duì)應(yīng)于左眼的盲點(diǎn)位置。
雖然有盲點(diǎn),所幸人是雙目視覺(jué),所以?xún)芍谎劬Φ拿^(qū)會(huì)通過(guò)雙目視覺(jué)來(lái)相互彌補(bǔ)。結(jié)果,日常生活中,人是感覺(jué)不到盲點(diǎn)的存在。不過(guò),如果單眼存在眼疾,如患上白內(nèi)障,那盲點(diǎn)的影響就比較大了,畢竟有個(gè)位置的信息是缺失的,這就需要通過(guò)多調(diào)整視角來(lái)消解這個(gè)困擾。
三、看不見(jiàn)的筆 -- 單眼與復(fù)眼
除了盲點(diǎn)外,還有種情況,人也會(huì)對(duì)目標(biāo)視而不見(jiàn)。各位不妨試著拿起一支筆,豎直放在左眼前面。 一開(kāi)始,你會(huì)感受到筆對(duì)視野造成的遮擋。再將眼睛盯著遠(yuǎn)處某目標(biāo),將筆緩慢遠(yuǎn)離眼睛,你將會(huì)發(fā)現(xiàn)這只筆并沒(méi)有對(duì)你看遠(yuǎn)處的景像形成任何障礙,筆似乎憑空消失了。顯然,這并非是生理性盲點(diǎn)造成的。它和人的視網(wǎng)膜結(jié)構(gòu)有關(guān)。換句話(huà)說(shuō),它可以從單眼與復(fù)眼的關(guān)系來(lái)解釋。
眾所周知,人有兩只眼睛,而昆蟲(chóng)則是由非常多的小眼睛組成的,俗稱(chēng)復(fù)眼,如蜻蜓、蒼蠅都有復(fù)眼。如果是昆蟲(chóng)的復(fù)眼,那么筆是不會(huì)對(duì)想觀測(cè)的目標(biāo)形成遮擋的。因?yàn)槔ハx(chóng)的整體視覺(jué)是可以通過(guò)小眼睛的視角拼接而成,少數(shù)幾只眼睛的被遮擋不影響全局??墒侨耸请p目視覺(jué),為什么也會(huì)有類(lèi)似的情況呢?實(shí)際上,人的視網(wǎng)膜上的感光細(xì)胞數(shù)量眾多,每個(gè)細(xì)胞都分擔(dān)了一部分的視覺(jué)檢測(cè)。在處理筆遮擋的任務(wù)時(shí),也會(huì)通過(guò)感光細(xì)胞間的相互填充,實(shí)現(xiàn)類(lèi)似復(fù)眼的功能。
但要注意的是,人是不可能像昆蟲(chóng)那樣演化出復(fù)眼的。因?yàn)閺?fù)眼上的每只眼睛,管的視角和頻率都很窄。如果要在人的頭部形成如同昆蟲(chóng)一樣具有全角度檢測(cè)能力的復(fù)眼,著名物理學(xué)家費(fèi)恩曼曾經(jīng)做過(guò)初略的計(jì)算,他的結(jié)論是復(fù)眼的大小可能會(huì)超過(guò)現(xiàn)在人類(lèi)頭部的尺寸,結(jié)果頭很可能承受不了眼睛的重量。
當(dāng)然,除了這些情況看不見(jiàn)外,人過(guò)于關(guān)注某些人或事情時(shí)會(huì)對(duì)周?chē)樾我暥灰?jiàn), 人不關(guān)注某些人或事情時(shí)也會(huì)視而不見(jiàn),或熟視無(wú)睹。這些依賴(lài)于情感和心靈的視而不見(jiàn)和熟視無(wú)睹,比起單從視覺(jué)上發(fā)生的,就要復(fù)雜多了,也是人工智能目前還完全找不到北的問(wèn)題之一。
參考文獻(xiàn):
1、克里斯托弗 · 查布利斯/丹尼爾 · 西蒙斯[著],段然[譯]. 看不見(jiàn)的大猩猩. 北京大學(xué)出版社,2011年
2、費(fèi)恩曼, 萊頓, 桑茲著. 鄭永令, 華宏鳴, 吳子儀等譯. 費(fèi)恩曼物理學(xué)講義(第1卷). 上??茖W(xué)技術(shù)出版社, 2013年