Rensink, Ronald A.?
The dynamic representation of scenes. Visual cognition,?
7(1-3):17–42, 2000.
https://readpaper.com/paper/2122710056
在Show, attend and tell中被提及
視覺創(chuàng)造的一個(gè)更強(qiáng)大的印象是一個(gè)連貫的、細(xì)節(jié)豐富的世界,在這個(gè)世界上,一切都同時(shí)存在。事實(shí)上,這種印象是如此令人信服,以至于我們傾向于將這些屬性不僅歸因于外部世界,也歸因于我們的內(nèi)部表征。但最近幾次實(shí)驗(yàn)的結(jié)果反對(duì)后一種說法。例如,在掃視、閃爍、眨眼或電影剪輯過程中,現(xiàn)實(shí)世界場景圖像中的變化通常不會(huì)引起注意。這種“變化盲癥”提供了強(qiáng)有力的證據(jù),證明我們的大腦中包含了一種場景的圖像化表示,這種表示到處都是細(xì)節(jié)和連貫的。那么我們?nèi)绾伪憩F(xiàn)一個(gè)場景呢?有人認(rèn)為,集中注意力提供了時(shí)空連貫性的穩(wěn)定表示一個(gè)對(duì)象的時(shí)間。然后有人認(rèn)為,注意力的分配可以協(xié)調(diào)起來,以創(chuàng)造一種“虛擬表征”。在這種方案中,形成了穩(wěn)定的對(duì)象表示
Corbetta, Maurizio and Shulman, Gordon L. Control of goal directed and stimulus-driven attention in the brain. Nature re
views neuroscience, 3(3):201–215, 2002.
https://readpaper.com/paper/2019370496
在Show, attend and tell中被提及
我們回顧了執(zhí)行不同注意功能的部分分離的大腦區(qū)域網(wǎng)絡(luò)的證據(jù)。其中一個(gè)系統(tǒng)包括頂葉內(nèi)皮質(zhì)和上額葉皮質(zhì)的部分,負(fù)責(zé)準(zhǔn)備和應(yīng)用目標(biāo)導(dǎo)向(自上而下)的刺激和反應(yīng)選擇。該系統(tǒng)還通過檢測刺激來調(diào)節(jié)。另一個(gè)系統(tǒng),包括顳頂皮質(zhì)和下額葉皮質(zhì),大部分位于右側(cè)半球,不參與自上而下的選擇。相反,該系統(tǒng)專門用于檢測與行為相關(guān)的刺激,特別是當(dāng)刺激顯著或意外時(shí)。這個(gè)腹側(cè)額頂網(wǎng)絡(luò)是背部系統(tǒng)的“斷路器”,將注意力引導(dǎo)到顯著事件上。這兩個(gè)注意系統(tǒng)在正常視覺中相互作用,并且在單側(cè)空間忽略中都受到干擾。
花書的第9章,9.10節(jié)有這樣的描述:
人眼大部分是非常低的分辨率,除了一個(gè)被稱為中央凹(fovea)的小塊。中央凹僅觀察在手臂長度距離內(nèi)一塊拇指大小的區(qū)域。雖然我們覺得自己可以看到高分辨率的整個(gè)場景,但這是由大腦的潛意識(shí)部分創(chuàng)建的錯(cuò)覺,因?yàn)樗翱p合”了我們瞥見的若干個(gè)小區(qū)域。大多數(shù)卷積網(wǎng)絡(luò)實(shí)際上接收大的全分辨率的照片作為輸入。人類大腦控制幾次眼動(dòng),稱為掃視(saccade),以瞥見場景中最顯眼的或任務(wù)相關(guān)的部分。將類似的注意力機(jī)制融入深度學(xué)習(xí)模型是一個(gè)活躍的研究方向。
The Dynamic Representation of Scenes (ubc.ca)
The Dynamic Representation of Scenes (ubc.ca)
??One of the more powerful impressions created by vision is that of a coherent, richly detailed world where everything is present simultaneously. Indeed, this impression is so compelling that we tend to ascribe these properties not only to the external world, but to our internal representations as well. ?But results from several recent experiments argue against this latter ascription. ?For example, changes in images of real-world scenes often go unnoticed when made during a saccade, flicker, blink, or movie cut. ?This “change blindness” provides strong evidence against the idea that our brains contain a picture-like representation of the scene that is everywhere detailed and coherent. ?
?How then do we represent a scene? ?It is argued here that focused attention provides spatiotemporal coherence for the stable representation of one object at a time. ?It is then argued that the allocation of attention can be co-ordinated to create a “virtual representation”. ?In such a scheme, a stable object representation is formed whenever needed, making it appear to higher levels asif all objectsin the?scene are represented in detail simultaneously.?
視覺創(chuàng)造的一個(gè)更強(qiáng)大的印象是一個(gè)連貫的、細(xì)節(jié)豐富的世界,在這個(gè)世界上,一切都同時(shí)存在。事實(shí)上,這種印象是如此令人信服,以至于我們傾向于將這些屬性不僅歸因于外部世界,也歸因于我們的內(nèi)部表征。但最近幾次實(shí)驗(yàn)的結(jié)果反對(duì)后一種說法。例如,在掃視、閃爍、眨眼或電影剪輯過程中,現(xiàn)實(shí)世界場景圖像中的變化通常不會(huì)引起注意。這種“變化盲癥”提供了強(qiáng)有力的證據(jù),反駁我們的大腦中包含了一種場景的圖像化表示,這種表示到處都是細(xì)節(jié)和連貫的。
那么我們?nèi)绾伪憩F(xiàn)一個(gè)場景呢?有人認(rèn)為,集中注意力提供了時(shí)空連貫性的穩(wěn)定表示一個(gè)對(duì)象的時(shí)間。然后有人認(rèn)為,注意力的分配可以協(xié)調(diào)起來,以創(chuàng)造一種“虛擬表征”。在這種方案中,只要需要,就可以形成穩(wěn)定的對(duì)象表示,使其看起來更高層次,就像場景中的所有對(duì)象都同時(shí)被詳細(xì)表示一樣。
引言
作為觀察者,我們最令人信服的印象之一是,我們被一個(gè)連貫、豐富的細(xì)節(jié)世界所包圍,在這個(gè)世界中,一切都同時(shí)存在。雖然我們的環(huán)境確實(shí)是這樣的,但這種印象是如此令人信服,以至于我們傾向于相信這些屬性也適用于我們的表征——也就是說,我們相信我們大腦中的某個(gè)地方是我們周圍穩(wěn)定而詳細(xì)的世界的穩(wěn)定而詳細(xì)的表征。
但這樣的代表真的存在嗎?視覺信息的收集是通過一個(gè)只有幾度視角的高分辨率視網(wǎng)膜來完成的。因此,完整的場景表示需要通過高容量視覺緩沖區(qū)整合單個(gè)眼睛注視的內(nèi)容(例如,F(xiàn)eldman,1985;Trehub,1991,1994)。但視網(wǎng)膜表現(xiàn)的不均勻性排除了簡單的固定疊加,因此任何整合過程都不那么簡單(Yeshurun&Schwartz,1989)。此外,即使可以進(jìn)行整合,也不清楚是否應(yīng)該進(jìn)行整合。即使對(duì)人類神經(jīng)系統(tǒng)來說,用與中心凹視覺相同的細(xì)節(jié)來表示我們周圍環(huán)境的計(jì)算要求也是壓倒性的(Rojer&Schwartz,1990)。即使所有這些信息都能以某種方式保存在我們的大腦中,其數(shù)量之多也會(huì)導(dǎo)致更高層次的過程對(duì)其有效訪問產(chǎn)生嚴(yán)重問題(Tsotsos,1990)。
這些理論保留得到了幾行實(shí)驗(yàn)工作的支持,所有這些工作都未能找到整合視覺緩沖的證據(jù)(見Irwin,1996;Simons&Levin,1997)。例如,當(dāng)在閃爍、眨眼、眼球運(yùn)動(dòng)、電影剪輯或其他此類中斷期間進(jìn)行更改時(shí),真實(shí)世界場景的圖像中的更改變得難以檢測。這種“變化盲癥”表明,積累的詳細(xì)信息很少。否則,通過將即時(shí)視覺輸入與緩沖區(qū)的內(nèi)容進(jìn)行比較,或者通過檢測原始圖像和變化圖像疊加形成的異常結(jié)構(gòu),變化檢測將很容易。事實(shí)上,在各種條件下都可能導(dǎo)致變化盲目性,加上基本效應(yīng)的強(qiáng)度和魯棒性,這表明未能積累詳細(xì)信息并不是僅在特殊情況下才會(huì)發(fā)生的異常現(xiàn)象。相反,它是我們代表周圍世界的方式的核心。
但如果我們?nèi)绱瞬簧朴诜e累視覺細(xì)節(jié),我們怎么能看到變化呢?如果我們沒有隨處可見的細(xì)節(jié)和連貫的表現(xiàn),為什么我們會(huì)有如此強(qiáng)烈的印象,認(rèn)為這些表現(xiàn)構(gòu)成了我們視覺體驗(yàn)的基礎(chǔ)?
本文對(duì)這些問題提出了一些可能的答案。它首先概述了注意力的連貫性理論,該理論描述了集中注意力如何形成穩(wěn)定的結(jié)構(gòu),從而能夠感知物體的變化。然后引入虛擬表示的概念來解釋如何協(xié)調(diào)注意力,以便稀疏的一組穩(wěn)定結(jié)構(gòu)可以給人一種場景表示在任何地方都是穩(wěn)定和詳細(xì)的印象。最后,提出了一種三元體系結(jié)構(gòu),展示了如何以與已知的視覺處理一致的方式創(chuàng)建虛擬表示。
如果我們不能積累視覺細(xì)節(jié),我們怎么能看到變化呢?為什么有些條件會(huì)導(dǎo)致變化盲,而其他條件則不會(huì)?這里提出的答案基于這樣一個(gè)建議,即需要集中注意力才能看到變化(Rensink,1997;Rensink,O'Regan和Clark,1997)。在正常情況下,世界上的任何變化都伴隨著一個(gè)運(yùn)動(dòng)信號(hào),它會(huì)引起人們對(duì)其位置的注意(例如Klein、Kingstone和Pontefract,1992)。只有當(dāng)該局部信號(hào)減弱(通過與掃視、閃爍、眼球鏈接、噴濺等相關(guān)的瞬變)時(shí),這種注意力引導(dǎo)才會(huì)丟失,從而導(dǎo)致失明。
然而,這種解釋產(chǎn)生了一個(gè)明顯的悖論。注意力被認(rèn)為是將視覺特征“焊接”到相對(duì)持久的對(duì)象表示上(Kahneman、Treisman和Gibbs,1992;Kanwisher和Driver,1992)。它也被認(rèn)為運(yùn)行速度相對(duì)較快,每秒運(yùn)行20-40個(gè)項(xiàng)目(例如Julesz,1984;Wolfe,1994)。但如果是這樣的話,為什么運(yùn)動(dòng)信號(hào)的淹沒會(huì)導(dǎo)致變化盲?為什么注意力不能在觀察的最初幾秒鐘內(nèi)簡單地焊接所有可見的項(xiàng)目,從而在所有條件下都能輕松檢測到變化?
這個(gè)問題的答案直指被關(guān)注的核心。本文提出注意效應(yīng)主要與連貫性有關(guān)。如本文所用,該術(shù)語不僅表示一組表征結(jié)構(gòu)1中的一致性,而且還表示邏輯互連,即,結(jié)構(gòu)指世界上相同時(shí)空實(shí)體的部分的一致性。因此,如果兩個(gè)相鄰結(jié)構(gòu)指的是在空間上延伸的相同對(duì)象,則它們在空間上是相干的。同樣,如果兩個(gè)連續(xù)的結(jié)構(gòu)指的是同一個(gè)對(duì)象,則它們在時(shí)間上是一致的,并隨時(shí)間延長。
此外,與其假設(shè)由注意力形成的結(jié)構(gòu)可以無限期地持續(xù)下去,不如假設(shè)它們的壽命實(shí)際上相當(dāng)短暫。特別是,注意力可能賦予結(jié)構(gòu)一種連貫性,這種連貫性只有在注意力指向結(jié)構(gòu)時(shí)才會(huì)持續(xù)。發(fā)展這一思路將導(dǎo)致注意力的連貫性理論:
(1) 在集中注意力之前,低水平的“原型物體”會(huì)在整個(gè)視野中快速平行地形成。這些原始物體可能相當(dāng)復(fù)雜,但在空間和時(shí)間上的連貫性有限。因此,它們是不穩(wěn)定的,當(dāng)任何新的刺激出現(xiàn)在它們的視網(wǎng)膜位置時(shí),它們就會(huì)被替換。
(2) 集中注意力就像一只隱喻之手,從不斷再生的能量流中抓住少數(shù)原型物體。當(dāng)這些物體被持有時(shí),它們形成了一個(gè)穩(wěn)定的物體,在空間和時(shí)間上具有更高的一致性。由于時(shí)間的連續(xù)性,該位置的任何新刺激都被視為現(xiàn)有結(jié)構(gòu)的變化,而不是新結(jié)構(gòu)的出現(xiàn)。
(3) 在集中注意力被釋放后,物體失去了連貫性,并分解回其組成的原始物體。很少或根本沒有參加的“后遺癥”。
根據(jù)連貫理論,只有在刺激發(fā)生變化時(shí)給予集中注意力,才能看到刺激的變化。由于在任何時(shí)候只能觀看少量項(xiàng)目(如Pashler,1988;Pylyshyn&Storm,1988),因此場景中的大多數(shù)項(xiàng)目都不會(huì)有穩(wěn)定的表現(xiàn)。因此,如果不能自動(dòng)將注意力轉(zhuǎn)移到變更上,則變更項(xiàng)目不太可能被關(guān)注,并且很可能會(huì)出現(xiàn)變更盲癥。
無人值守原型對(duì)象的有限相干性
通常認(rèn)為,視覺感知的最低水平2提供了對(duì)觀看者可見的基于場景的屬性的詳細(xì)地圖式表示或“草圖”(圖1)。這些代表性結(jié)構(gòu)被認(rèn)為是視網(wǎng)膜主題,并在圖像中快速(即幾百毫秒內(nèi))平行形成,無需集中注意力(例如Marr,1982;Rensink,1992;Rensink&Enns,1998)。由于不涉及集中注意力,連貫理論認(rèn)為這些結(jié)構(gòu)在空間和時(shí)間上的連貫性是有限的。
空間相干性有限的大部分證據(jù)來自視覺研究實(shí)驗(yàn)。早期研究的結(jié)果表明,空間連貫性是最小的,沒有參與的結(jié)構(gòu)僅限于簡單的斑點(diǎn)和條狀物(例如Julesz,1984)。但是,盡管這一初級(jí)階段反映了可靠測量的局限性,但它并不反映低級(jí)處理的局限性。后來的實(shí)驗(yàn)表明存在第二階段,在該階段中,局部交互能夠“快速且骯臟”地恢復(fù)各種基于場景的屬性,如面部曲率(Ramachandran,1988)、傾斜(Enns&Rensink,1991)和陰影(Rensink&Cavanagh,1993)。但即使在這一階段,收集信息的范圍也存在限制,例如,對(duì)于大于4°的項(xiàng)目,快速線解釋失敗(von Grünau&Dubé,1994)。
在第二階段發(fā)現(xiàn)了幾種類型的快速分組(Elder&Zucker,1993;Rensink&Enns,1995),以及閉塞圖形的快速完成(Enns&Rensink,1992;He&Nakayama,1992;Rensink&Enns,1998)。因此,低水平過程似乎不僅與基于地層的屬性的恢復(fù)有關(guān),而且還與它們形成“原始物體”有關(guān),即與世界上的局部結(jié)構(gòu)相對(duì)復(fù)雜的碎片組合。最近的研究還表明,原型物體是直接引起注意的最低層次的結(jié)構(gòu),它們的許多基本細(xì)節(jié)只有經(jīng)過深思熟慮才能獲得(例如Rensink&Enns,1995年、1998年)。因此,原型對(duì)象具有“雙面”性質(zhì),不僅是低級(jí)視覺的最高級(jí)別輸出,而且是高級(jí)注意過程可以作用的最低級(jí)別操作數(shù)。
原始物體有限時(shí)間一致性的證據(jù)主要來自視覺整合的研究,該研究表明,只有當(dāng)刺激物位于同一視網(wǎng)膜位置且彼此相距約100毫秒時(shí),刺激物才能隨時(shí)間整合(例如Dillolo,1980)。超出這些限制,似乎無法添加、比較或以其他方式組合連續(xù)演示文稿的細(xì)節(jié)(如Irwin,1996)。這些結(jié)果,加上變化盲研究的結(jié)果,提供了強(qiáng)有力的證據(jù),證明早期水平的結(jié)構(gòu)具有內(nèi)在的不穩(wěn)定性:它們要么被后續(xù)刺激覆蓋,要么在幾百毫秒內(nèi)消失(Rensink,O'Regan和Clark,1997年,本期)。請(qǐng)注意,這種波動(dòng)性處于原型對(duì)象的水平,而不是pix els。如果一個(gè)新的刺激物中間有一個(gè)空白,那么該位置的內(nèi)容將是新原型對(duì)象的一部分,因此仍將被覆蓋(Enns&Dillo,1997;Rensink,本期)??傊谌魏翁囟ǖ墓潭ㄖ行纬傻牟輬D都可能非常詳細(xì),但幾乎沒有連貫性,只要光線繼續(xù)進(jìn)入眼睛,就會(huì)持續(xù)再生,并且在每次眼球運(yùn)動(dòng)后基本上會(huì)重新生成。3.
鑒于無人看管的結(jié)構(gòu)只有有限的空間和時(shí)間連貫性,因此集中注意力必須提供連貫性,將它們編織成更大規(guī)模的物體,并允許它們隨時(shí)間保持連續(xù)性。注意,后一個(gè)屬性4對(duì)于變化的感知尤其重要,因?yàn)檫B續(xù)性允許將新刺激的出現(xiàn)視為現(xiàn)有結(jié)構(gòu)的轉(zhuǎn)換,而不是全新結(jié)構(gòu)的形成。
因此,在這種觀點(diǎn)中,集中注意力與對(duì)物體的感知密切相關(guān)。物體的基本屬性包括要求它是離散的,與背景不同,并且在空間和時(shí)間上具有一致性。它也必須是一個(gè)個(gè)體,從字面上說,如果一個(gè)物體被拆開,它就不能被分割而不失去其完整性,其結(jié)果是一組部分,而不是一組與原始物體相似的物體(例如,Smith,1998)。
為了捕捉這些特性,連貫理論認(rèn)為集中注意力一次只涉及一個(gè)物體的表現(xiàn)。這一限制來自研究表明,對(duì)于某些任務(wù),注意力似乎只作用于一個(gè)對(duì)象(例如,Deubel&Schneider,1996;Garavan,1998;Rensink,1998a)。與較低層次結(jié)構(gòu)的注意互動(dòng)被認(rèn)為是通過一個(gè)關(guān)系發(fā)生的,這個(gè)關(guān)系是一個(gè)單一的結(jié)構(gòu),包含對(duì)被注意對(duì)象的簡要描述,例如其大小、整體形狀和主色調(diào)。在nexus中,內(nèi)部連接可以計(jì)算這些總和屬性,并提供一種簡單存儲(chǔ)它們的方法。6.
當(dāng)一個(gè)原型對(duì)象被關(guān)注時(shí),它和nexus之間就建立了一個(gè)鏈接,從而在這些結(jié)構(gòu)之間實(shí)現(xiàn)了信息的雙向傳輸(圖2)。鏈接上的信息允許nexus從參與的proto對(duì)象獲取所選屬性的描述。沿著鏈路傳輸?shù)男畔⒎催^來可以為易揮發(fā)的原始物體提供穩(wěn)定性,使其在短暫遮擋或眼睛移動(dòng)時(shí)能夠保持或快速再生。除其他外,鏈接還可以在不斷變化的原始對(duì)象坐標(biāo)和更穩(wěn)定的以觀察者(或?qū)ο螅橹行牡膎exus坐標(biāo)之間進(jìn)行映射。當(dāng)鏈接在nexus和它的原型對(duì)象之間建立了一個(gè)循環(huán)的信息流時(shí),產(chǎn)生的電路被稱為相干場。
實(shí)驗(yàn)還表明,對(duì)于某些任務(wù),可以同時(shí)參加四到六個(gè)項(xiàng)目(例如,Pylyshyn&Storm,1988;Rensink,本期)。在這種情況下,相干場仍然包含一個(gè)單一的nexus,但現(xiàn)在擴(kuò)展到包括幾個(gè)原型對(duì)象,通過與這些結(jié)構(gòu)的鏈接確定nexus屬性(圖2)。關(guān)系與其原型對(duì)象之間的信息循環(huán)流動(dòng)不僅在空間上建立了連貫性,而且還形成了一種記憶,在時(shí)間上也建立了連貫性。用一種更具隱喻性的方式來描述這一點(diǎn),注意力可以被視為一只手,它用大約四到六個(gè)“手指”來“抓住”原型對(duì)象,所選擇的結(jié)構(gòu)然后形成一個(gè)連貫的對(duì)象,只要它們被“握住”。
請(qǐng)注意,nexus及其原型對(duì)象形成了一個(gè)“局部層次結(jié)構(gòu)”,只有兩個(gè)級(jí)別的描述(對(duì)象級(jí)和零件級(jí))。這種層次結(jié)構(gòu)是一種非常有用的方法,也是表示對(duì)象的自然方式(Marr,1982,第305-307頁)。例如,一個(gè)原型對(duì)象可以被注意地細(xì)分,并將鏈接分配給它的各個(gè)部分;這將對(duì)應(yīng)于向下遍歷該對(duì)象的部分-整個(gè)層次結(jié)構(gòu)的一個(gè)級(jí)別。相反,鏈接可以分配給幾個(gè)廣泛分離的原型對(duì)象,形成一個(gè)組,該組將對(duì)應(yīng)于一級(jí)以上的(粗編碼)對(duì)象。因此,即使集中注意力的能力可能有限(如Pashler,1988;Rensink,本期),快速遍歷部分-整個(gè)層次結(jié)構(gòu)的能力使其能夠快速訪問對(duì)象結(jié)構(gòu)的任何方面。
在任何時(shí)候都可以參與的信息量有限,這解釋了為什么觀察員無法檢測到“參與”對(duì)象的變化(Levin&Simons,1997)。當(dāng)注意力集中在世界上的某個(gè)事物上時(shí),通常不可能在一個(gè)連貫的領(lǐng)域中表現(xiàn)出它的所有細(xì)節(jié),只有它的幾個(gè)方面可以在任何時(shí)候在關(guān)系中表現(xiàn)出來。如果所代表的一個(gè)方面是世界上變化的一個(gè)方面,那么變化就會(huì)被看到;否則,改變的盲目性仍然會(huì)產(chǎn)生。
相干理論的最后一部分涉及一旦焦點(diǎn)被轉(zhuǎn)移,相干場的命運(yùn)??紤]到一次只能代表一個(gè)物體,如果注意力轉(zhuǎn)移到另一個(gè)物體上,相干場就無法維持。在這種情況下,鏈接被解除,先前參與的部分恢復(fù)為其作為易失性原型對(duì)象的原始狀態(tài)。再次訴諸于手的隱喻:集中注意力的釋放就像手上物品的釋放,這些物品回到“原始軟泥”,即不斷再生的低層次結(jié)構(gòu)的流動(dòng)。
因此,從這個(gè)角度來看,將注意力集中在一個(gè)結(jié)構(gòu)上幾乎沒有或沒有什么后遺癥,至少在檢測變化的能力方面是如此。當(dāng)然,對(duì)于之前參加過的項(xiàng)目,存在短期記憶(STM)(如Cowan,1988)。但在這里,STM是一種與對(duì)象類型有關(guān)的抽象內(nèi)存;相反,一致性場被認(rèn)為體現(xiàn)了視覺短時(shí)記憶(vSTM),一種支持對(duì)象標(biāo)記形成的純視覺記憶,因此在注意力被撤回后可能包含很少或沒有信息。
在極端情況下,vSTM可以被識(shí)別為由相干場形成的記憶,這導(dǎo)致除了所關(guān)注的內(nèi)容之外沒有vSTM的位置。換句話說,關(guān)注一個(gè)項(xiàng)目對(duì)于它在vSTM中是必要和充分的。這一立場的證據(jù)好壞參半(如Pashler&Carrier,1996年)。但生理學(xué)研究表明,短期(或工作)記憶的機(jī)制與集中視覺注意力的機(jī)制相似,事實(shí)上,這兩種機(jī)制非常相似,可能根本沒有區(qū)別(Awh&Jonides,1998;Desimone,1996)。此外,心理物理學(xué)研究表明,對(duì)于以前參與視覺搜索任務(wù)的項(xiàng)目,可能完全缺乏記憶(Wolfe,1996)。因此,這一立場似乎至少得到了某種程度的支持。
與其他工作的關(guān)系
Shiffrin和Schneider(1977年)最有影響力的早期注意力模型之一。在他們看來,STM是LTM的“激活”子集,注意選擇要激活的特定LTM項(xiàng)目。連貫理論在幾個(gè)方面與此不同。首先,它將注意力視為直接時(shí)空結(jié)構(gòu)(或標(biāo)記)的形成,而不是長期類別(或類型)的激活。其次,Shiffrin和Schneider認(rèn)為,經(jīng)過充分實(shí)踐后,任何過程都可以在沒有注意的情況下運(yùn)行,而連貫性理論則認(rèn)為對(duì)變化的感知總是需要注意。最后,Shiffrin和Schneider提出的激活可以在注意力被撤回后持續(xù),而當(dāng)這種情況發(fā)生時(shí),相干場會(huì)崩潰。需要注意的是,根據(jù)相干理論,STM仍有可能持續(xù)激活。這里的建議是,這對(duì)于vSTM(或視覺工作記憶)是不可能的,vSTM是一個(gè)完全與時(shí)空結(jié)構(gòu)相關(guān)的完全不同的系統(tǒng)。
相干場的概念更接近于Kahneman等人(1992)的建議,即時(shí)空結(jié)構(gòu)由“對(duì)象文件”表示,其中各種屬性綁定在一起。兩種觀點(diǎn)都認(rèn)為,有注意的表征結(jié)構(gòu)只需要描述時(shí)空實(shí)體,而不需要與長期記憶中存儲(chǔ)的描述相匹配。但是,盡管對(duì)象文件可能包含關(guān)于非可視屬性的信息(例如要做出的適當(dāng)響應(yīng)),但nexus屬性僅限于純粹的可視屬性,或可從可視屬性派生的抽象屬性(例如語義標(biāo)識(shí))。更重要的是,一旦建立,一個(gè)目標(biāo)文件可能會(huì)被處理,也可能不會(huì)被處理,因此一次可以維護(hù)多個(gè)文件;相反,只有一個(gè)連接點(diǎn)(可能鏈接到多個(gè)結(jié)構(gòu)),一旦注意力被撤回,其相關(guān)場就會(huì)崩潰。
尤其是相干場的概念,其鏈接集也與Pylyshyn和Storm(1988)提出的FINSTs(“實(shí)例化的手指”)概念有一些相似之處。finst是指針,它提供有人參與的對(duì)象的訪問路徑,不斷地向更高級(jí)別的進(jìn)程通知它們的位置;據(jù)推測,一次大約可以使用五個(gè)Finst。finst和link都為高級(jí)流程提供了有關(guān)低級(jí)結(jié)構(gòu)的信息,并且都可以穩(wěn)定這些結(jié)構(gòu)以獲得隨時(shí)間的連續(xù)性。但是FinstStrans只是將一個(gè)項(xiàng)目的位置提升到更高的層次,而鏈接則以循環(huán)的方式傳遞多種視覺信息。此外,F(xiàn)inSt被分配給完全獨(dú)立的對(duì)象,而鏈接則被納入一個(gè)對(duì)應(yīng)于單個(gè)對(duì)象的關(guān)系中(盡管該對(duì)象可能有多個(gè)部分)。7因?yàn)镕inSt有盡可能多的鏈接,鏈接可能解釋FinSt解釋的所有結(jié)果,例如跟蹤和subitizing(Pylyshyn&Storm,1988;Trick&Pylyshyn,1993)。此外,單個(gè)nexus的約束解釋了為什么顯示器中孤立點(diǎn)的跟蹤可以更好地解釋為單個(gè)虛擬對(duì)象的角點(diǎn)跟蹤(Yantis,1992)。
連貫理論也與研究相一致,研究表明,當(dāng)觀察者關(guān)注場景中的特定對(duì)象或事件時(shí),他們往往無法報(bào)告其他意外項(xiàng)目的出現(xiàn)(Mack&Rock,1998)。最近的研究表明,與其說沒有看到這些項(xiàng)目,不如說沒有記住它們(Moore&Egeth,1997;Wolfe,1997)。這種解釋與感知的“此時(shí)此地”是一致的,在這種“此時(shí)此地”中,相當(dāng)詳細(xì)和復(fù)雜的不穩(wěn)定表現(xiàn)在沒有注意的情況下不斷地構(gòu)建和重建。
虛擬表示
先前提出的注意力理論有一個(gè)相當(dāng)違反直覺的含義:在任何時(shí)候,一個(gè)環(huán)境或場景中只有一個(gè)物體可以被給予連貫的表示。此外,這種表示在其可包含的信息量上是有限的。但如果是這樣,為什么我們沒有注意到這些限制?為什么我們覺得大腦中的某個(gè)地方是場景中所有物體的完整、詳細(xì)的再現(xiàn)?
要回答這個(gè)問題,考慮如何在日常生活中使用對(duì)象。對(duì)于大多數(shù)任務(wù),任何時(shí)候都只有一個(gè)物體在起作用:一個(gè)杯子被抓住,一個(gè)朋友被認(rèn)出,一個(gè)超速的騎車人被避開。此“目標(biāo)”對(duì)象可能需要詳細(xì)表示,但其他對(duì)象不需要詳細(xì)表示。盡管似乎有一些任務(wù)(如雜耍)屬于例外情況,但這些任務(wù)通常是通過快速來回切換來處理的,因此在任何時(shí)候都只有一個(gè)目標(biāo)。因此,盡管我們可能需要表示場景的各個(gè)方面(例如背景),但在任何特定時(shí)間,我們似乎都不需要對(duì)場景中的多個(gè)對(duì)象進(jìn)行詳細(xì)表示。
這種認(rèn)識(shí)產(chǎn)生了虛擬表示的想法:我們不需要對(duì)周圍的所有對(duì)象進(jìn)行詳細(xì)的表示,而只表示眼前需要的對(duì)象。如果可以協(xié)調(diào)注意力,以便在需要時(shí)形成一個(gè)對(duì)象的連貫、詳細(xì)的表示,那么場景的表示將出現(xiàn)在更高的層次上,就好像它是“真實(shí)的”,也就是說,就好像所有對(duì)象都同時(shí)以非常詳細(xì)的方式表示一樣。這樣的表示將擁有真實(shí)表示的所有功能,同時(shí)在處理和內(nèi)存資源方面所需的資源將少得多。
示例:訪問計(jì)算機(jī)網(wǎng)絡(luò)
為了更好地理解虛擬表示的含義,考慮訪問包含在諸如萬維網(wǎng)(圖3)的大型網(wǎng)絡(luò)中的數(shù)據(jù)的問題。一方面是瀏覽器工作站,它在內(nèi)存中所能保存的信息量有限。另一方面是網(wǎng)絡(luò),數(shù)千臺(tái)機(jī)器擁有信息。假設(shè)現(xiàn)在我們希望工作站訪問包含在不同站點(diǎn)的數(shù)據(jù)。這應(yīng)該如何處理?
如果有足夠的內(nèi)存,工作站可以包含網(wǎng)絡(luò)中所有計(jì)算機(jī)中包含的所有數(shù)據(jù)的完整副本。但這需要大量的內(nèi)存。此外,每次從網(wǎng)絡(luò)上的一臺(tái)機(jī)器添加或刪除數(shù)據(jù)時(shí),都必須將數(shù)據(jù)廣播給所有其他機(jī)器,從而導(dǎo)致巨大的傳輸成本。
因此,網(wǎng)絡(luò)設(shè)計(jì)通常支持更動(dòng)態(tài)的數(shù)據(jù)訪問方法。如果我們想查看特定站點(diǎn)上的信息,我們的工作站會(huì)檢查它是否已經(jīng)在內(nèi)存中。如果是這樣,就不需要做更多的事情了。否則,它將向適當(dāng)?shù)恼军c(diǎn)發(fā)送請(qǐng)求,并加載請(qǐng)求的信息(圖3)。如果傳輸速度足夠快,我們的工作站將顯示包含網(wǎng)絡(luò)中的所有信息。但在現(xiàn)實(shí)中,這些信息將只有一個(gè)虛擬的表示形式:它不是全部同時(shí)出現(xiàn)在工作站中,而是在需要時(shí)被簡單地訪問。8.
為了了解這種策略如何解釋具有有限容量注意力機(jī)制的場景感知,考慮兩個(gè)問題之間的相似之處:
工作站可以容納一個(gè)(或最多幾個(gè))站點(diǎn)的內(nèi)容。
網(wǎng)絡(luò)上有數(shù)千個(gè)站點(diǎn),包含大量信息。
工作站無法保存所有這些信息。
注意力可以控制一個(gè)(或最多幾個(gè))物體的內(nèi)容
可見場景中有數(shù)千個(gè)對(duì)象,包含大量信息。
注意力無法掌握所有這些信息。
考慮到問題的類似結(jié)構(gòu),可以使用類似的解決方案(圖4):
如果站點(diǎn)中的信息已保存在內(nèi)存中,請(qǐng)使用它。
如果某個(gè)對(duì)象的信息已被處理,請(qǐng)使用它。
否則,請(qǐng)找到所需的站點(diǎn),并加載信息。
否則,請(qǐng)定位所需的原型對(duì)象,并使其一致。
結(jié)果是網(wǎng)絡(luò)內(nèi)容的虛擬表示。
結(jié)果是可見場景內(nèi)容的虛擬表示。
在計(jì)算機(jī)網(wǎng)絡(luò)的情況下,如果一個(gè)低容量工作站(僅限于一個(gè)或兩個(gè)站點(diǎn))同時(shí)保存網(wǎng)絡(luò)上的所有信息,那么網(wǎng)絡(luò)請(qǐng)求的有效協(xié)調(diào)就顯得非常重要。類似地,注意力請(qǐng)求的有效協(xié)調(diào)可以使高級(jí)過程看起來好像一個(gè)有限容量的連貫場(限于一個(gè)或兩個(gè)對(duì)象)同時(shí)持有場景中所有對(duì)象的所有信息。
因此,即使我們有意識(shí)的頭腦可能會(huì)有這樣的印象,即我們面前的所有物體都在我們大腦的某個(gè)地方同時(shí)得到了詳細(xì)、連貫的表示,但情況并非如此。相反,這可能源于一個(gè)更為稀疏的“即時(shí)”系統(tǒng),該系統(tǒng)只是在正確的時(shí)間提供正確的對(duì)象表示。
需要注意的是,這種完整感并不一定意味著表示真的是完整的,也就是說,它表示視圖中的所有對(duì)象。這也并不意味著它正確地代表了所有這些。與靜態(tài)“真實(shí)”表示一樣,動(dòng)態(tài)虛擬表示可能無法表示特定對(duì)象,或者可能表示不正確。因此,表示的虛擬或真實(shí)程度與其準(zhǔn)確性或完整性無關(guān)。
成功運(yùn)作的條件
盡管虛擬表示可以節(jié)省大量計(jì)算資源,但這些節(jié)省并不是免費(fèi)的。虛擬表示通過在時(shí)間上權(quán)衡增加的復(fù)雜性來降低空間上的復(fù)雜性。只有特定類型的信息處理任務(wù)才能利用這種權(quán)衡。視覺感知是其中之一嗎?
虛擬表示法成功運(yùn)行的關(guān)鍵在于:(1)在任何時(shí)候,只有一個(gè)(或最多幾個(gè))對(duì)象需要“真實(shí)”表示法;(2)在需要時(shí),必須提供有關(guān)任何對(duì)象的詳細(xì)信息。對(duì)于大多數(shù)(如果不是全部)視覺任務(wù),第一個(gè)要求很容易滿足。我們通常一次只需要注意一個(gè)物體,例如,抓住它,或者看看它的方向。涉及多個(gè)目標(biāo)對(duì)象的任務(wù)通常可以通過“分時(shí)”來處理,即通過在對(duì)象之間快速來回切換注意力。
在大多數(shù)正常觀看條件下,也滿足了按請(qǐng)求訪問的要求。如果有一種方法可以將眼球運(yùn)動(dòng)和注意力轉(zhuǎn)移到所請(qǐng)求對(duì)象的位置,則可以從入射光流中獲得視覺細(xì)節(jié)。因此,不需要對(duì)象的高容量視覺記憶—信息通??梢詮氖澜绫旧慝@得。正如Stroud(1955)很久以前指出的那樣:“由于我們的照明通常是連續(xù)的陽光,并且大部分風(fēng)景保持不變,因此物理對(duì)象可以作為自己的短期記憶。”。斯特勞德的洞見最近得到了復(fù)興,有幾項(xiàng)建議進(jìn)一步支持這樣一種觀點(diǎn),即大部分感知是通過將世界作為其自身的最佳模型來理解的(例如布魯克斯,1991年;丹尼特,1991年;格里姆斯,1996年;奧雷根,1992年)。
請(qǐng)注意,當(dāng)光線無法將信息從物體傳送到眼睛時(shí),或者當(dāng)物體本身被某種方式遮擋時(shí),此方案會(huì)出現(xiàn)問題。但這些條件也會(huì)干擾物體感知本身,不管使用的是何種記憶模式,因此不會(huì)對(duì)虛擬表征的使用構(gòu)成嚴(yán)重障礙。
更重要的是從短期(或工作)知覺的角度考慮照明和遮擋,也就是說,在幾秒鐘的持續(xù)時(shí)間內(nèi)感知事件。由于白天的照明相當(dāng)恒定,因此在某個(gè)特定時(shí)間看到的物體幾乎總是在很短的時(shí)間后被照亮。因此,光照波動(dòng)不太可能干擾短期感知。同樣,在幾秒鐘的時(shí)間內(nèi),先前看到的物體突然被遮擋的情況也相對(duì)少見。因此,關(guān)于在某一特定時(shí)間看到的對(duì)象的信息在幾秒鐘后幾乎總是可用的。因此,虛擬表示可以是處理真實(shí)場景中包含的大量信息的可靠和有效的方法,至少對(duì)于短期感知而言是如此。
普遍適用性
虛擬表示是一種強(qiáng)大的信息處理策略,是現(xiàn)代計(jì)算機(jī)和網(wǎng)絡(luò)設(shè)計(jì)的核心(例如Tanenbaum,1976)。不幸的是,這種表現(xiàn)形式長期以來一直被忽視,作為解釋知覺和認(rèn)知加工的一種方式,直到最近才開始探索其在這方面的潛力(例如Brooks,1991;Dennett,1991)。甚至這些研究中的許多都不是集中在生物信息處理上,而是演示了它在人工系統(tǒng)中的有效性。
在最一般的層面上,關(guān)于虛擬表征的工作說明了指示(或索引)表征的力量。在指示語表征中,對(duì)細(xì)節(jié)信息的記憶很少;相反,重點(diǎn)放在提取幾個(gè)關(guān)鍵的“方面”,然后作為世界實(shí)體的指針(例如Ballard、Hayhoe、Pook和Rao,1997;Clancey,1997)。子系統(tǒng)之間的交互也可以通過這種方式處理,使用一些關(guān)鍵的行為方面,而不是目標(biāo)或其他子系統(tǒng)中信息的詳細(xì)表示(例如Brooks,1991)。在所有這些情況下,指示表征的力量是由表征結(jié)構(gòu)及其語境(即世界本身或一組相互作用的子系統(tǒng))共同決定的。在這一觀點(diǎn)中,表征并不構(gòu)成世界或其鄰居的副本,而是簡單地協(xié)調(diào)所涉及的各種系統(tǒng)的行動(dòng)。
三元結(jié)構(gòu)
虛擬表征在人類視覺中的成功應(yīng)用需要在適當(dāng)?shù)臅r(shí)間對(duì)適當(dāng)?shù)奈矬w進(jìn)行眼球運(yùn)動(dòng)和注意力轉(zhuǎn)移。但是什么引導(dǎo)了這些運(yùn)動(dòng)和轉(zhuǎn)變?在人們注意到一個(gè)物體之前,如何知道它的位置?如果注意力沒有后遺癥,那么在注意力被撤回后,怎么會(huì)有對(duì)場景的記憶呢?
對(duì)所有這些問題的明確、詳細(xì)的回答將在很大程度上構(gòu)成一個(gè)完整的愿景理論,而這一理論目前尚不存在。因此,本節(jié)僅提供一種可能性的示意圖。這張草圖并不意味著是確定的。相反,它只是為了表明可以對(duì)這些問題給出一個(gè)答案,一個(gè)允許以與人類視覺處理相關(guān)的方式進(jìn)行虛擬表示的答案。
這里提出的解決方案首先拋棄了所有視覺加工都通過一個(gè)單一注意點(diǎn)的假設(shè)。盡管這種“以注意力為中心”的視覺模式具有極大的直覺吸引力,但它可能與現(xiàn)實(shí)不符。最近的研究表明,可能不存在單一的注意點(diǎn):在視覺系統(tǒng)的不同層次上,甚至可能在不同的處理流中,可能會(huì)發(fā)現(xiàn)被松散地定義為“注意”的能力有限的過程(例如Allport,1992)。如果是這樣的話,用于物體感知的注意系統(tǒng)將只是眾多系統(tǒng)中的一個(gè),其他系統(tǒng)同時(shí)運(yùn)行,并且在很大程度上獨(dú)立于它。
進(jìn)一步發(fā)展這一觀點(diǎn)將導(dǎo)致三元體系結(jié)構(gòu),其中包含三個(gè)基本獨(dú)立的系統(tǒng)(圖5)。第一種是低層次系統(tǒng),它可以快速創(chuàng)建高度詳細(xì)、不穩(wěn)定的結(jié)構(gòu)。第二個(gè)是一個(gè)容量有限的注意力系統(tǒng),它將這些結(jié)構(gòu)形成穩(wěn)定的對(duì)象表征。這兩個(gè)系統(tǒng)已經(jīng)是連貫理論的一部分。現(xiàn)在增加的是一個(gè)容量有限的非注意力系統(tǒng),它提供了引導(dǎo)注意力的設(shè)置10。該“設(shè)置系統(tǒng)”至少涉及場景結(jié)構(gòu)的三個(gè)方面:
(1) 對(duì)場景的抽象意義或要點(diǎn)的感知(例如,場景是否為海港、城市、野餐、谷倉等)。這可以提供一種有用的方法來區(qū)分注意力的優(yōu)先級(jí),將注意力引導(dǎo)到在這種情況下最重要的對(duì)象。
(2) 感知場景中對(duì)象的空間排列或布局。這可以提供各種結(jié)構(gòu)位置的非易失性表示,當(dāng)注意力被引導(dǎo)到場景中的特定對(duì)象時(shí),可以使用該表示。
(3) 調(diào)用存儲(chǔ)在長期內(nèi)存中的抽象場景模式,可能是通過要點(diǎn)或布局信息。一旦調(diào)用,這可以促進(jìn)對(duì)這兩個(gè)量的感知,并最終通過相關(guān)的交互促進(jìn)對(duì)對(duì)象的感知。
這種架構(gòu)與早期的提議有些相似,即場景感知涉及到對(duì)要點(diǎn)的初步提取和隨后對(duì)細(xì)節(jié)的細(xì)化(例如Loftus,1976)。然而,它與這些不同之處在于,從未構(gòu)建完整的場景表示,盡管在觀看過程中可以改進(jìn)要點(diǎn)和布局的表示,但在任何時(shí)間始終只保留一個(gè)連貫的對(duì)象表示。因此,這種架構(gòu)體現(xiàn)了視角的根本變化:場景表示不再是由眼球運(yùn)動(dòng)和注意力轉(zhuǎn)移建立起來的結(jié)構(gòu),而是指導(dǎo)這些活動(dòng)的結(jié)構(gòu)。
主旨
一個(gè)場景最抽象的方面是它的意義,或主旨。該數(shù)量在許多不同的眼睛位置和視點(diǎn)以及環(huán)境中對(duì)象的組成和布局的變化中保持不變。因此,它可以對(duì)預(yù)期的對(duì)象類型提供穩(wěn)定的約束,甚至可能表明它們對(duì)手頭任務(wù)的重要性(Friedman,1979)。
Gist可以在演示后120毫秒內(nèi)確定(Biederman,1981;Intraub,1981;Potter,1976),這段時(shí)間不足以處理兩到三個(gè)以上的項(xiàng)目。此外,它可以從高度模糊的圖像中提取,并且實(shí)際上不需要注意,可以同時(shí)確定兩個(gè)不同的GIST(Oliva&Schyns,1997)。與這些發(fā)現(xiàn)一致,gist似乎不是由同時(shí)或甚至事后感知的對(duì)象決定的(例如Henderson,1992)。因此,它可以通過簡單的測量來確定,例如圖像中的線方向或顏色分布(例如,蓋林·獨(dú)孤埃、伯納德和奧利瓦,1998年),或存在于低水平的原物體的其他屬性。
布局
場景結(jié)構(gòu)的另一個(gè)重要方面是布局,即場景中物體的空間排列,不考慮視覺特性或語義特征(Hochberg,1968)。這個(gè)量至少來自一個(gè)異中心參照系,它隨眼睛位置的變化而變化;因此,它可以用于指導(dǎo)眼球運(yùn)動(dòng)和注意力轉(zhuǎn)移。
視覺系統(tǒng)似乎能在幾秒鐘內(nèi)提取出至少一些布局信息,并能在短暫的時(shí)間間隔內(nèi)保持這些信息(Sanocki&Epstein,1997;Simons,1996)。但所涉及的記憶不同于相干場的記憶——它保持空間位置而不是視覺特性,涉及整個(gè)場景(或至少一組對(duì)象),而不僅僅是單個(gè)對(duì)象。它似乎也不易波動(dòng),即使在沒有注意的情況下也能持久(Chun&Nakayama,本期;Haber,1985)。重要的是要注意,即使布局是在非注意記憶中進(jìn)行的,這并不意味著布局是非注意獲得的。例如,它可能是從場景中提取出來的,并通過一系列注意力轉(zhuǎn)移或眼球運(yùn)動(dòng)進(jìn)入記憶。
場景模式
gist和布局信息的不變性不僅允許這些數(shù)量為其他操作提供相對(duì)穩(wěn)定的上下文,還促進(jìn)了場景約束的長期學(xué)習(xí)。場景的長期記憶似乎不僅涉及場景類別,還涉及相關(guān)的表征集合或場景圖式(例如,Arbib,1990;Friedman,1979;Intraub,1997)。
gist和布局涉及有限生命周期的短期(或工作)表示,而場景模式是可能無限期持續(xù)的長期結(jié)構(gòu)。這使得他們能夠積累信息,因此他們的內(nèi)容可以比調(diào)用他們的感知結(jié)構(gòu)更加詳細(xì)和復(fù)雜。例如,場景模式被認(rèn)為包括場景中可能存在的對(duì)象清單,以及布局的各個(gè)方面,例如清單對(duì)象的相對(duì)位置(例如Mandler&Parker,1976)。
系統(tǒng)間的相互作用
在這里提出的三元體系結(jié)構(gòu)中,場景的表示涉及三個(gè)不同系統(tǒng)的動(dòng)態(tài)交互。如何進(jìn)行?
在查看場景時(shí),快速的低級(jí)過程提供了對(duì)查看者可見的特性的持續(xù)生成草圖。Gist可能由其中的一個(gè)子集確定,隨后的過程試圖驗(yàn)證調(diào)用的模式(Antes&Penland,1981;Friedman,1979)。與模式一致的項(xiàng)不需要詳細(xì)編碼,因?yàn)轵?yàn)證可能涉及對(duì)預(yù)期特性的簡單檢查。換句話說,物體只需要被檢測到,而不需要構(gòu)建其結(jié)構(gòu)的一致表示(Henderson,1992)。如果在圖像中遇到意外的結(jié)構(gòu),更復(fù)雜的(注意)過程可以形成其結(jié)構(gòu)的連貫表示,嘗試確定其語義身份,或重新評(píng)估要點(diǎn)。同時(shí),感知到的項(xiàng)目布局可以用來檢查當(dāng)前的解釋,以及幫助引導(dǎo)對(duì)所請(qǐng)求對(duì)象的注意。
因此,這組交互提供了一種創(chuàng)建場景中所有對(duì)象的虛擬表示的方法。這也可能有助于解釋為什么我們對(duì)所有對(duì)象都有同時(shí)出現(xiàn)的印象(通過虛擬表示),以及為什么我們對(duì)所有背景位置的細(xì)節(jié)都有同時(shí)出現(xiàn)的印象(可能通過不穩(wěn)定的原型對(duì)象集)。
還值得指出的是,一些有趣的效應(yīng)可以用這些相互作用的分解來解釋。例如,如果集中注意力被一個(gè)物體的形成所占據(jù),一個(gè)無人參與的刺激可以引起啟動(dòng)(Shapiro,Driver,Ward和Sorensen,1997),或者進(jìn)入長期記憶(Chun和Jiang,1998),即使它沒有被有意識(shí)地感知。這可以用注意力系統(tǒng)“鎖定”特定物體來解釋,看不見的信息沿著其他非注意力流傳播。事實(shí)上,如果這些非注意力流中的一條能夠檢測(但不支持感知)某種變化,這就可以解釋為什么觀察者有時(shí)可以猜測變化已經(jīng)發(fā)生,即使他們沒有明確意識(shí)到(費(fèi)爾南德斯·杜克和桑頓,本期)。另一個(gè)效應(yīng)是“思維視覺”,觀察者強(qiáng)烈感覺到某些東西正在改變,但沒有伴隨的視覺體驗(yàn)(Rensink,1998b)。在這里,這種變化可能是由一個(gè)非注意子系統(tǒng)檢測到的,然后它會(huì)提醒注意系統(tǒng)。警報(bào)中傳輸?shù)男畔⒉灰欢ê艽螅@可以解釋為什么觀察者對(duì)變化的內(nèi)容或位置知之甚少。請(qǐng)注意,這種解釋與盲視的解釋類似,11盲視依賴于處理流的類似分離(Milner&Goodale,1995)。
總結(jié)
有人提出,一種動(dòng)態(tài)的表征是我們對(duì)場景感知的基礎(chǔ)。這一提議的一個(gè)組成部分是注意力的連貫性理論,該理論認(rèn)為無人看管的結(jié)構(gòu)是不穩(wěn)定的,需要集中注意力來充分穩(wěn)定它們,以允許對(duì)變化的感知。另一個(gè)組成部分是視覺利用虛擬表征的主張,虛擬表征是一種動(dòng)態(tài)的表征形式,在這種表征形式中,注意力可以準(zhǔn)確地在需要時(shí)提供對(duì)所需對(duì)象的詳細(xì)、連貫的描述。提出了三元體系結(jié)構(gòu)作為創(chuàng)建這種表示的一種可能方法。此體系結(jié)構(gòu)使用穩(wěn)定的表示和包含大量視覺細(xì)節(jié)的表示。但在任何時(shí)候都不會(huì)使用既穩(wěn)定又包含大量細(xì)節(jié)的表示。
在這種觀點(diǎn)下,人們對(duì)表現(xiàn)的印象既穩(wěn)定又詳細(xì)是由于注意力的仔細(xì)協(xié)調(diào)。在結(jié)果描述包含所需信息的范圍內(nèi),我們作為觀察者的印象將是一個(gè)非常詳細(xì)的環(huán)境,準(zhǔn)確地描述了那些最重要的方面。只有當(dāng)?shù)退降乃沧儽谎谏w或由于不適當(dāng)?shù)母咚娇刂贫缓鲆晻r(shí),注意力協(xié)調(diào)才會(huì)崩潰,導(dǎo)致虛擬表征的真實(shí)本質(zhì)侵入我們的感知意識(shí)。