愛犯錯(cuò)的智能體(四):火星人臉的陰影

1

火星人臉


人類對(duì)外星文明的尋找和癡迷自古就有記載。所以,每每看到拍攝于外星球的照片,必然會(huì)情緒激動(dòng),試圖從中獲取存在外星人的蛛絲馬跡。


圖1(a)是一張1986年美國(guó)“海盜1號(hào)”火星探測(cè)器在火星“西多尼亞”地區(qū)拍攝的照片。如果直接對(duì)圖做分析,即使用到上文講過的先驗(yàn)知識(shí),也不太容易發(fā)現(xiàn)什么信息。


不過,圖像處理工作者多少懂點(diǎn)PS,會(huì)對(duì)圖像先做些處理。首先,這張圖像比較偏暗,先得讓圖像變亮點(diǎn),得到圖1(b)。其次,早期火星探測(cè)器拍攝的照片易受設(shè)備或其它電磁干擾影響,會(huì)在圖像上產(chǎn)生一些白點(diǎn)和黑點(diǎn),即圖像屆俗稱的“鹽”和“胡椒”組成的椒鹽噪聲,如圖1(b)。這類噪聲由于處在圖像像素亮度的兩個(gè)極端,比較容易通過圖像處理技術(shù)消解,得到圖1(c)。而圖1(c)的亮度過于集中在灰色區(qū)域,需要用相應(yīng)的技術(shù)將圖像亮度的變化或動(dòng)態(tài)范圍擴(kuò)大,以便于人類更方便感知其中的差異,于是有了廣為流傳的圖1(d)。


??圖1 火星人臉的圖像處理過程


圖1(d)是曾經(jīng)很著名的“火星人臉”。據(jù)小道消息,當(dāng)年前蘇聯(lián)的一群“科學(xué)家”們從美國(guó)宇航局公開的網(wǎng)站上拿到一組火星照片,對(duì)原始圖片進(jìn)行類似上述的處理后便得到了這張照片。大家非常激動(dòng),因?yàn)閳D上有一張看似立體的人臉,眼睛、鼻子、嘴巴都非常逼真。可是按拍攝的距離和目標(biāo)比例來估計(jì),顯然不可能是人力可為之,更何況有記載的人類文明從未有人去過火星。他們便推測(cè)這可能是外星人留下的遺跡。盡管美國(guó)宇航局一直強(qiáng)調(diào),這只是光學(xué)和圖像后處理的視覺錯(cuò)覺。但在當(dāng)時(shí),這種強(qiáng)調(diào)被認(rèn)為是刻意掩蓋外星文明的陰謀論。


從那時(shí)開始,媒體對(duì)火星人的幻想一直持續(xù)不斷,前前后后拍過的經(jīng)典電影不少。有與火星人發(fā)生戰(zhàn)爭(zhēng)的《火星人玩轉(zhuǎn)地球》和《世界之戰(zhàn)》,也有幻想和平相處的,如2000年拍攝的、圍繞火星人臉和火星文明展開的《火星任務(wù)》。


為了能“走近科學(xué)”,答疑解惑,美國(guó)宇航局后來又做了幾次火星探索。1998和2001年對(duì)火星人臉位置進(jìn)行了再次偵測(cè)。從發(fā)回的照片看,“火星人臉”只是一座普通的山丘,如圖2(a)-(c)所示。但由于當(dāng)時(shí)火星正值多云天氣,照片效果不佳,大眾并不認(rèn)可其結(jié)論。2015年7月,歐洲宇航局“火星快車”探測(cè)器飛越火星“人臉”上空時(shí),拍下幾幅高清晰照片。其拍攝的3D成像照片清楚地呈現(xiàn)了火星人臉的地形,如圖2(d)所示。它表明在其他角度觀察“火星人臉”時(shí),并沒有任何人臉的特征在上面,只是自然界腐蝕的結(jié)果而已。


? ?圖2 ?不同年代、不同角度下的火星人臉


通過這些努力,多少打消了大家對(duì)火星人的幻想。2015年的電影《火星救援》更是把火星描繪成荒無人煙的沙漠。主人公馬克因意外不得不獨(dú)自火星上生存,在絕對(duì)的孤獨(dú)中只能靠刺激感官的搖滾和迪斯科音樂來振作精神。比如,他在改裝戰(zhàn)神四號(hào)準(zhǔn)備逃離火星時(shí),聽著與披頭士齊名的、ABBA樂隊(duì)1974年成名曲“Waterloo”(滑鐵盧)。


不過,上個(gè)月底(2018年7月30日)在火星南極發(fā)現(xiàn)了巨大的地下湖,又讓人對(duì)火星生命產(chǎn)生了新的希望和聯(lián)想。


然而,不管有沒有火星人,“火星人臉”的視覺錯(cuò)覺來源于兩個(gè)因素,一是人對(duì)人臉的先驗(yàn)知識(shí),另一個(gè)是陰影幫助人們建立的立體視覺。


2

陰影


陰影是日常生活最常見的。太陽(yáng)升起來,照在桑干河上,河邊的景物便有了影子。


??圖3 陰影的形成與分類[1]


一般來說,陰影有四類,如圖3所示。光照在物體上,被物體完全遮擋在地面形成的陰影稱為全影(Cast Shadow);由于光源大小差異在全影以外形成的陰影稱為半影(Penumbra);物體表面因光源變化而導(dǎo)致光的強(qiáng)弱變化,未被遮擋部分稱為陰影(Shading),而被遮擋部分稱為附著陰影(Attached Shadow)。另外,如果把陰影的類型作為課堂習(xí)題,學(xué)生回答不上來拿不到滿分的時(shí)候,說不定還會(huì)增加一個(gè)心理陰影。


陰影對(duì)人的認(rèn)知、人工智能的發(fā)展有著不可忽視的影響,利弊共存。


首先,人對(duì)陰影的認(rèn)知,并非與生俱來的。1到2歲的小孩發(fā)現(xiàn)腳下連著個(gè)影子時(shí),并不會(huì)馬上明白這只是光學(xué)現(xiàn)象,反而可能會(huì)因?yàn)樗Σ坏舳a(chǎn)生短暫的恐懼感。成語(yǔ)中的“杯弓蛇影”也反映了影子對(duì)心理認(rèn)知的影響。那么,未來的機(jī)器人能賦予這種“心理陰影”的認(rèn)知能力嗎?


其次,陰影的存在為人類識(shí)別目標(biāo)的大小、遠(yuǎn)近、運(yùn)動(dòng)方向和數(shù)量等提供了參考,好的、壞的都有。它對(duì)許多人工智能的實(shí)際應(yīng)用也造成了不小的障礙。


舉例來說,今年3月的首例無人駕駛車撞人致死事件就與之有一定關(guān)系,如圖4所示。從美國(guó)優(yōu)步(Uber)公司公開的事故報(bào)告來看,當(dāng)時(shí)優(yōu)步無人車上的駕駛員把激光雷達(dá)測(cè)距儀關(guān)掉了,結(jié)果使得無人駕駛只能僅依賴攝像頭獲取的圖像來實(shí)現(xiàn)自主駕駛。由于夜幕對(duì)駕駛周邊環(huán)境形成的巨大陰影,推車的受害者在出現(xiàn)前被完全掩蔽在黑暗中。分析的結(jié)果表明,雖然視頻中人被檢測(cè)出來了,但低于閾值。不過,報(bào)告沒有提及在陰影中人是否被檢測(cè)出了。這些多少說明,陰影的存在,使得智能駕駛系統(tǒng)在判斷目標(biāo)是否為人時(shí)的確定性顯著降低了。


由于確定性的降低,在等被害者從陰影中走出后,系統(tǒng)沒能輸出緊急剎車的指令,最終導(dǎo)致了慘劇的發(fā)生。這次事故也直接影響到了整個(gè)無人智能駕駛行業(yè)的研究。


圖4: ?優(yōu)步無人駕駛事故中的4幀圖片


陰影對(duì)目標(biāo)的跟蹤和計(jì)數(shù)的干擾也很嚴(yán)重。如圖5(a)中,如果不能將車輛和其陰影分離,智能駕駛就無法精確定位車輛、車形和測(cè)距[2]。再如圖5(b)的計(jì)數(shù)問題,如果缺乏好的陰影抑制或去除算法,則會(huì)影響對(duì)羊群的準(zhǔn)確計(jì)數(shù),進(jìn)而可能影響某些人或智能機(jī)器人的“睡眠”。


圖5 (a)?未進(jìn)行陰影抑制的車輛檢測(cè)[2];


??(b) ?陰影與羊群計(jì)數(shù)


但是,目前的陰影分離和去除仍沒有特別好的人工智能和計(jì)算機(jī)視覺算法[3]。有學(xué)者將陰影和實(shí)際圖像看成是兩個(gè)獨(dú)立變量,利用獨(dú)立分量分析(Independent Component Analysis)的技術(shù)來過濾和分離陰影。也有學(xué)者希望借顏色恒常知覺(Retinex)來設(shè)計(jì)算法去除陰影[4,5]。最近的深度學(xué)習(xí)技術(shù),有考慮采用深度卷積網(wǎng)的[6],也可以考慮采用“圖像+編輯”的思路、通過生成式對(duì)抗網(wǎng)絡(luò)或自編碼網(wǎng)絡(luò)來去除陰影。然而,由于陰影的多樣性,要構(gòu)造陰影去除的終極算法并不容易。更何況,這項(xiàng)研究在人工智能和計(jì)算機(jī)視覺領(lǐng)域本就屬于小眾研究。


另外,去除陰影也并非都是好的,因?yàn)殛幱皶?huì)幫助人們形成立體視覺,以及對(duì)觀測(cè)目標(biāo)距離的正確判斷。在這種情況下,過濾或消除陰影可能導(dǎo)致危險(xiǎn)的后果,尤其在智能駕駛中。比如圖6中,陰影的位置可以讓人對(duì)目標(biāo)的空間位置產(chǎn)生明顯不同的判斷。如果沒有陰影,就很難猜測(cè)紙到底是W形狀還是M形狀了[1]。


?圖6 ?筆的陰影對(duì)折紙結(jié)構(gòu)的幫助 [1]


值得指出的是,陰影如此有用,可將全部陰影類型均用于繪畫藝術(shù)的卻并不多。在繪畫中,用得最廣泛的是材料本身形成的陰影。而能反映物體運(yùn)動(dòng)和時(shí)間變化的全影(Cast shadow)則較少被使用。Jacobson和Werner曾分析了大量古代的繪畫作品,發(fā)現(xiàn)有兩幅表現(xiàn)這些變化的作品[7]。一幅是作者Giorgio de Chirico畫的“正午的教堂”。作者用長(zhǎng)長(zhǎng)的陰影配合明亮、正午的天空來形成永恒?(timelessness)的感覺。一幅是作者M(jìn)asaceio畫的“耶酥門徒猶大的故事”。他將猶大走路時(shí)形成的陰影畫成透明的,通過覆蓋在路邊信徒的身上來表達(dá)圣經(jīng)中曾經(jīng)描述過的神跡:猶大經(jīng)過的地方,路邊虔誠(chéng)信徒的頑疾會(huì)不治而愈。


圖7 正午的教堂(左)?和猶大用影子治愈信徒的故事(右)[7]


盡管全影能提供目標(biāo)的運(yùn)動(dòng)信息,Jacobson和Werner認(rèn)為這一信息很難在繪圖中被表現(xiàn)出來,因而全影在繪畫中是可有可無的(expendable)[7]。


類似地,在人工智能和計(jì)算機(jī)視覺領(lǐng)域,基于靜態(tài)陰影的研究相對(duì)多些,但基于陰影的變化來估計(jì)目標(biāo)的距離、形狀、運(yùn)動(dòng)速度等的文章則少了很多??紤]到他能提供的豐富輔助信息,相信未來會(huì)有更多的學(xué)者會(huì)把動(dòng)態(tài)陰影的分析加入到人工智能的研究中。


3

人工智能戰(zhàn)爭(zhēng)下的仿生與陰影


陰影對(duì)自然界的生物也很重要。以昆蟲為例,昆蟲的背殼往往比其腹部要黑得多。當(dāng)其停在某處時(shí),暗的背殼靠近光,?形成的陰影可以有效的掩蓋其腹部體征。按格式塔統(tǒng)一論,昆蟲就變成一個(gè)整體,其立體感消失,變得完全不像一個(gè)固體的、三維的“東西”,?從而達(dá)到偽裝的效果?[8]。


這一特性實(shí)際上也可以為軍事領(lǐng)域的間諜和竊聽昆蟲所利用。尤其在不久的將來,隨著人工智能研究的快速發(fā)展,未來仿生機(jī)器人的體積將會(huì)更加微型化時(shí)。


那么,要發(fā)現(xiàn)這類仿生機(jī)器人,一個(gè)直接的辦法就是設(shè)法還原甚至放大其原有的立體感。一個(gè)最簡(jiǎn)單的辦法就是利用光線來主動(dòng)重建陰影。本人常受蚊蟲困擾,不堪之余就會(huì)用強(qiáng)光手電筒來尋找隱藏在床角、椅凳下的蚊子,屢試不爽。原因也簡(jiǎn)單,強(qiáng)光能破壞蚊子的“陰影”,還原其立體結(jié)構(gòu),甚至可以放大蚊子的尺寸。成功消滅蚊子的時(shí)候,偶爾也會(huì)想想,如果能將其重建陰影的過程自動(dòng)化,說不定就能用于未來人工智能戰(zhàn)爭(zhēng)下的反竊聽。這種方法的好處是不用增加昂貴且復(fù)雜的設(shè)備、簡(jiǎn)單易行,隨后的微小目標(biāo)識(shí)別只需用常規(guī)的目標(biāo)檢測(cè)技術(shù)即可實(shí)現(xiàn)。


不難看出,陰影對(duì)人類的認(rèn)知和人工智能都有著很重要的作用,但要利用好它卻并非易事。除了陰影外,還有什么簡(jiǎn)單因素,也會(huì)讓愛犯錯(cuò)的智能體繼續(xù)犯錯(cuò)呢?



參考文獻(xiàn):

1. P. Mamassian, D. C. Knill and D. Kersten. The perception of cast shadows. Trends in Cognitive Sciences, vol. 2, no. 8, 287-295, 1998.

2. A. Prati, I. Mikic, C. Grana and M. M. Trivedi. Shadow Detection Algorithms for Traffic Flow Analysis: A Comparative Study. in Proc. 4th IEEE Int. Conf. Intelligent Transportation Systems, Oakland, CA, Aug. 2001.

3. A. Sanin, C. Sanderson and B. C. Lovell. Shadow detection: A survey and comparative evaluation of recent methods. Pattern Recognition, vol. 45, issue 4, pages 1684-1695, 2012.

4. G. D. Finlayson, S. D. Hordley, and M.S. Drew. Removing shadows from images using Retinex. IS& TISID Tenth Color Image Conference. 2002.

5. E. H. Land. The Retinex theory of color vision. Scientific American, pages, 108-129, 1977.

6. S. H. Khan, M. Bennamoun, F. Sohel, and R. Togneri. Automatic shadow detection and removal from a single image. IEEE TPAMI, vol. 38, no. 3, 431-456, 2016.

7. J. Jacobson, and S. Werner. Why cast shadows are expendable: Insensitivity of human observers and the inherent ambiguity of cast shadows in pictorial art. Perception, vol. 33, pages. 1369-1383, 2004.

8. R. R. Behrens. ?On Max Wertheimer and Pablo Picasso: Gestalt Theory, Cubism and Camouflage. Gestalt Theory: Journal of the GTA, vol. 20, no. 2, 109-118, 1998.?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本白皮書前期在國(guó)標(biāo)委工業(yè)二部和工信部科技司的指導(dǎo)下,通過梳理人工智能技術(shù)、應(yīng)用和產(chǎn)業(yè)演進(jìn)情況,分析人工智能的技術(shù)熱...
    筆名輝哥閱讀 24,611評(píng)論 2 143
  • C++層實(shí)現(xiàn)原文:http://www.itdecent.cn/p/16fa878f74c2 因?yàn)閘ua層 沒有I...
    人氣小哥閱讀 2,465評(píng)論 1 0
  • 敦煌,富麗華酒店。正有一場(chǎng)簽到儀式——007徒步游學(xué)簽到。 閆小主拿完打卡手環(huán),在等房卡。不經(jīng)意的回眸間,看到明黃...
    初苗說閱讀 479評(píng)論 4 3
  • 挨揍了 清晨劉銘醒來時(shí),凌綾已經(jīng)離開,劉銘揉了揉發(fā)暈的腦袋,穿上衣服走下床,簡(jiǎn)單漱洗之后,來到客廳,餐桌上...
    犁地成佛閱讀 604評(píng)論 0 50
  • 4.30 我在無人的寂寞之海 海風(fēng)微撫,仿佛呼喚 告訴我你的到來 我睜開雙眼 遠(yuǎn)處的海岸線 想不到那么蜿蜒 我用呼...
    roll閱讀 360評(píng)論 1 2

友情鏈接更多精彩內(nèi)容