姓名:杜敏剛? ? ? 學(xué)號(hào):17021211253
【嵌牛導(dǎo)讀】計(jì)算機(jī)視覺(jué)是使用計(jì)算機(jī)及相關(guān)設(shè)備對(duì)生物視覺(jué)的一種模擬。它的主要任務(wù)就是通過(guò)對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的三維信息,就像人類和許多其他類生物每天所做的那樣。由于計(jì)算機(jī)視覺(jué)學(xué)在工農(nóng)業(yè)生產(chǎn)、地質(zhì)學(xué)、天文學(xué)、氣象學(xué)、醫(yī)學(xué)及軍事并學(xué)等領(lǐng)域有著極大的潛在應(yīng)用價(jià)值,所以它在國(guó)際上越來(lái)越受人重視。本文簡(jiǎn)要地介紹了計(jì)算機(jī)視覺(jué)學(xué)結(jié)構(gòu)和研究?jī)?nèi)容,它同附近學(xué)科的關(guān)系,計(jì)算機(jī)視覺(jué)研究中面臨的技術(shù)難點(diǎn)以及計(jì)算機(jī)視覺(jué)學(xué)的歷史,現(xiàn)狀和研究動(dòng)向。
【嵌牛鼻子】計(jì)算機(jī)視覺(jué);圖像;應(yīng)用
【嵌牛提問(wèn)】什么是計(jì)算機(jī)視覺(jué)?計(jì)算機(jī)視覺(jué)技術(shù)有哪些應(yīng)用?
【嵌牛正文】
1緒論
計(jì)算機(jī)視覺(jué)學(xué)是自二十世紀(jì)六十年代中期迅速發(fā)展起來(lái)的一門新學(xué)科。它是個(gè)邊緣學(xué)科,集眾家之所長(zhǎng),是個(gè)工程性很強(qiáng)的技術(shù),主要需要有空間幾何、矩陣分析、光電技術(shù)、圖像處理、應(yīng)用數(shù)學(xué)、離散數(shù)學(xué)及計(jì)算機(jī)技術(shù)等等各個(gè)方面的知識(shí),才能正確的指導(dǎo)視覺(jué)系統(tǒng)的建模、解模及實(shí)際工程問(wèn)題的解決方法。計(jì)算機(jī)視覺(jué)系統(tǒng)一般有光源、攝像機(jī)、采集卡及PC軟件系統(tǒng)等組成,可以完成圖像的采集與處理、目標(biāo)的識(shí)別功能,視覺(jué)系統(tǒng)的結(jié)構(gòu)一般是從系統(tǒng)的模型的角度理解的。
計(jì)算機(jī)視覺(jué)既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個(gè)富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺(jué)是一門綜合性的學(xué)科,它已經(jīng)吸引了來(lái)自各個(gè)學(xué)科的研究者參加到對(duì)它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號(hào)處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。
計(jì)算機(jī)視覺(jué)學(xué)所研究的對(duì)象,簡(jiǎn)單地說(shuō)就是研究如何讓計(jì)算機(jī)通過(guò)圖象傳感器或其它光傳感器來(lái)感知、分析和理解周圍環(huán)境。
人類感知外界環(huán)境主要通過(guò)視覺(jué),聽(tīng)覺(jué)和觸覺(jué)等四大感覺(jué)系統(tǒng)。其中視覺(jué)系統(tǒng)是最復(fù)雜的。人類從外界獲得的信息中視覺(jué)信號(hào)量最大。
模仿人類的視覺(jué)系統(tǒng),計(jì)算機(jī)視覺(jué)系統(tǒng)中信息的處理和分析大致可以分成兩個(gè)階段:圖象處理階段又稱視覺(jué)處理中的低水平和中水平階段;圖象分析、理解階段又稱視覺(jué)處理中的高水平處理階段。
在圖象處理階段,計(jì)算機(jī)對(duì)圖象信息進(jìn)行一系列的加工處理,這主要是:
1、校正成象過(guò)程中系統(tǒng)引進(jìn)的光度學(xué)和幾何學(xué)的畸變,抑制和去除成象過(guò)程中引進(jìn)的噪聲—統(tǒng)稱為圖象的恢復(fù)。
2、從圖象信息如亮度分布信息中提取諸如邊沿信息,深度信息圖象點(diǎn)沿軸方向的尺度,表面三維傾斜方向信息等反映客觀景物特征的信息。
3、根據(jù)抽取的特征信息把反映三維客體的各個(gè)圖象基元,如輪廓、線條、紋理、邊緣、邊界、物體的各個(gè)面等從圖象中分離出來(lái),并且建立起各個(gè)基元之間的拓樸學(xué)上的和幾何學(xué)上的關(guān)系—稱之基元的分割和關(guān)系的確定。
在圖象分析和理解階段,計(jì)算機(jī)根據(jù)事先存貯在數(shù)據(jù)庫(kù)中的預(yù)知識(shí)模型,識(shí)別出各個(gè)基元或某些基元組合所代表的客觀世界中的某些實(shí)體稱之為模型匹配以及根據(jù)圖象中各基元之間的關(guān)系在預(yù)知識(shí)的指導(dǎo)下得出圖象所代表的實(shí)際景物的含義,得出圖象的解釋或描述。
必須強(qiáng)調(diào),預(yù)知識(shí)在視覺(jué)系統(tǒng)中起著相當(dāng)重要的作用。在預(yù)知識(shí)庫(kù)中存放著各種實(shí)際可能遇到的物體的知識(shí)模型,和實(shí)際景物中各種物體之間的約束關(guān)系。計(jì)算機(jī)的作用是根據(jù)被分析的圖象中的各基元及其關(guān)系,利用預(yù)知識(shí)作為指導(dǎo),通過(guò)匹配,搜索和推理等手段,最終得到對(duì)圖象的描述。在整個(gè)過(guò)程中預(yù)知識(shí)時(shí)刻提供處理的樣板和證據(jù)。每一步的處理結(jié)果隨時(shí)同預(yù)知識(shí)進(jìn)行對(duì)比。有時(shí),處理的中間結(jié)果和最終結(jié)果還要饋送給預(yù)知識(shí)庫(kù)作為知識(shí)的更新和積累。
2圖像分割研究
圖像分割是圖像處理與機(jī)器視覺(jué)的基本問(wèn)題之一。其要點(diǎn)是:把圖像劃分成若干互不交迭區(qū)域的集合。這些區(qū)域要么對(duì)當(dāng)前的任務(wù)有意義,要么有助于說(shuō)明它們與實(shí)際物體或物體的某些部分之間的對(duì)應(yīng)關(guān)系。圖像分割的應(yīng)用十分廣泛,幾乎出現(xiàn)在有關(guān)圖像處理的所有領(lǐng)域,并涉及各種類型的圖像。例如,在遙感應(yīng)中,合成孔徑雷達(dá)圖像中目標(biāo)的分割;遙感云圖中不同云系和背景分布的分割;在交通圖像分析中,把車輛目標(biāo)從背景中分割出來(lái)。在這些應(yīng)用中,分割通常是為了進(jìn)一步對(duì)圖像進(jìn)行分析、識(shí)別、壓縮編碼,分割的準(zhǔn)確性直接影響后續(xù)任務(wù)的有效性。
一般來(lái)講,分割出的區(qū)域需同時(shí)滿足均勻性和連通性的條件。其中均勻性是指在該區(qū)域中的所有象素點(diǎn)都滿足基于灰度、紋理、彩色等特征的某種相似性準(zhǔn)則;連通性是指在該區(qū)域內(nèi)存在任意兩點(diǎn)的路徑。盡管圖像處理和機(jī)器視覺(jué)界的研究者們?yōu)榇烁冻隽碎L(zhǎng)期的努力,符合以上兩點(diǎn)的通用性分割仍面臨著巨大的困難;大部分研究成果都是針對(duì)某一類型圖像、某一具體應(yīng)用的分割??梢愿爬橐韵聝?nèi)容。
2.1數(shù)據(jù)驅(qū)動(dòng)的分割
常見(jiàn)的數(shù)據(jù)驅(qū)動(dòng)分割包括基于邊緣檢測(cè)的分割、基于區(qū)域的分割、邊緣與區(qū)域相結(jié)合的分割等。對(duì)于基于邊緣檢測(cè)的分割,其基本思想是先檢測(cè)圖像中的邊緣點(diǎn),再按一定策略連接成輪廓,從而構(gòu)成分割區(qū)域。難點(diǎn)在于邊緣檢測(cè)時(shí)抗噪聲性能和檢測(cè)精度的矛盾,若提高檢測(cè)精度,則噪聲產(chǎn)生的偽邊緣會(huì)導(dǎo)致不合理的輪廓;若提高抗噪聲性能,則會(huì)產(chǎn)生輪廓漏檢和位置偏差。為此,人們提出各種多尺度邊緣檢測(cè)方法,根據(jù)實(shí)際問(wèn)題設(shè)計(jì)多尺度邊緣信息的結(jié)合方案,以較好地兼顧抗噪聲性能和檢測(cè)精度。
基于區(qū)域的分割的基本思想是根據(jù)圖像數(shù)據(jù)的特征將圖像空間劃分成不同的區(qū)域。常用的特征包括:直接來(lái)自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。方法有閾值法、區(qū)域生長(zhǎng)法、聚類法、松弛法等。
邊緣檢測(cè)能夠獲得灰度或彩色值的局部變化強(qiáng)度,區(qū)域分割能夠檢測(cè)特征的相似性與均勻性。將兩者結(jié)合起來(lái),通過(guò)邊緣點(diǎn)的限制,避免區(qū)域的過(guò)分割;同時(shí)通過(guò)區(qū)域分割補(bǔ)充漏檢的邊緣,使輪廓更加完整。例如,先進(jìn)行邊緣檢測(cè)與連接,再比較相鄰區(qū)域的特征(灰度均值、方差),若相近則合并;對(duì)原始圖像分別進(jìn)行邊緣檢測(cè)和區(qū)域生長(zhǎng),獲得邊緣圖和區(qū)域片段圖后,再按一定的準(zhǔn)則融合,得到最終分割結(jié)果。
2.2模型驅(qū)動(dòng)的分割
常見(jiàn)的模型驅(qū)動(dòng)分割包括基于動(dòng)態(tài)輪廓(Snakes)模型、組合優(yōu)化模型、目標(biāo)幾何與統(tǒng)計(jì)模型。Snakes模型用于描述分割目標(biāo)的動(dòng)態(tài)輪廓。由于其能量函數(shù)采用積分運(yùn)算,具有較好的抗噪聲性,對(duì)目標(biāo)的局部模糊也不敏感,因而適用性很廣。但這種分割方法容易收斂到局部最優(yōu),因此要求初始輪廓應(yīng)盡可能靠近真實(shí)輪廓。
近年來(lái)對(duì)通用分割方法的研究?jī)A向于將分割看作一個(gè)組合優(yōu)化問(wèn)題,并采用一系列優(yōu)化策略完成圖像分割任務(wù)。主要思路是在分割定義的約束條件之外,根據(jù)具體任務(wù)再定義一個(gè)優(yōu)化目標(biāo)函數(shù),所求分割的解就是該目標(biāo)函數(shù)在約束條件下的全局最優(yōu)解。以組合優(yōu)化的觀點(diǎn)處理分割問(wèn)題,主要是利用一個(gè)目標(biāo)函數(shù)綜合表示分割的各種要求和約束,將分割變?yōu)槟繕?biāo)函數(shù)的優(yōu)化求解。由于目標(biāo)函數(shù)通常是一個(gè)多變量函數(shù),可采用隨機(jī)優(yōu)化方法。
基于目標(biāo)幾何與統(tǒng)計(jì)模型的分割是將目標(biāo)分割與識(shí)別集成在一起的方法,常稱作目標(biāo)檢測(cè)或提取?;舅枷胧菍⒂嘘P(guān)目標(biāo)的幾何與統(tǒng)計(jì)知識(shí)表示成模型,將分割與識(shí)別變?yōu)槠ヅ浠虮O(jiān)督分類。常用的模型有模板、特征矢量模型、基于連接的模型等。這種分割方法能夠同時(shí)完成部分或全部識(shí)別任務(wù),具有較高的效率。然而由于成像條件變化,實(shí)際圖像中的目標(biāo)往往與模型有一定的區(qū)別,需要面對(duì)誤檢與漏檢的矛盾,匹配時(shí)的搜索步驟也頗為費(fèi)時(shí)。
2.3圖像分割的半自動(dòng)方法
從人工參與程度來(lái)看,圖像分割可分為人工、半自動(dòng)、自動(dòng)等三種類型。其中人工分割完全由操作者利用鼠標(biāo)勾畫(huà)出分割區(qū)域的輪廓,費(fèi)時(shí)費(fèi)力,且容易受操作者主觀因素的影響,重復(fù)性差。自動(dòng)分割不需人機(jī)交互,但適應(yīng)性差,很難實(shí)現(xiàn)對(duì)一批圖像同時(shí)獲得滿意的分割效果。半自動(dòng)分割將人機(jī)交互與自動(dòng)分割相結(jié)合,能夠適應(yīng)不同的圖像和需求,且有效降低計(jì)算復(fù)雜度。目前半自動(dòng)分割中人機(jī)交互的方式有:勾畫(huà)目標(biāo)的大致輪廓,構(gòu)成自動(dòng)分割的初始化;根據(jù)特定的圖像和任務(wù)調(diào)整算法參數(shù);在分割過(guò)程中加入人工交互節(jié)等??傊?從實(shí)用化的角度看,自動(dòng)分割仍是長(zhǎng)期努力的方向。目前更為現(xiàn)實(shí)的是在自動(dòng)分割前或分割過(guò)程中加入人機(jī)交互的半自動(dòng)分割。其發(fā)展方向?yàn)楸M可能少和簡(jiǎn)便的人機(jī)交互??梢?jiàn),圖像分割是圖像處理和機(jī)器視覺(jué)必不可少的重要環(huán)節(jié),也是圖像理論發(fā)展的瓶頸之一。隨著計(jì)算機(jī)速度與容量的快速進(jìn)展,圖像處理與機(jī)器視覺(jué)實(shí)用化系統(tǒng)碩果累累。例如,基于內(nèi)容的圖像檢索系統(tǒng)、智能監(jiān)視系統(tǒng)、視覺(jué)引導(dǎo)的智能交通系統(tǒng)、手寫(xiě)體字符/人臉/指紋/虹膜識(shí)別系統(tǒng)等。然而有關(guān)的理論研究并沒(méi)有取得突破性進(jìn)展。
3視覺(jué)技術(shù)的研究
人類很多研究都是以延伸人類能力為目的的,早期的工作是在體力上延伸,計(jì)算機(jī)發(fā)明以來(lái),就拓展到對(duì)人類腦力和感知能力的延伸上。對(duì)人類視覺(jué)感知能力的計(jì)算機(jī)模擬導(dǎo)致了計(jì)算機(jī)視覺(jué)的產(chǎn)生。計(jì)算機(jī)視覺(jué)也經(jīng)常被稱為圖像理解,是指研究完成一項(xiàng)任務(wù)所需的視覺(jué)信息及如何從圖像中獲取這些信息的研究領(lǐng)域。其基本目的有三個(gè):
(1)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;
(2)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的運(yùn)動(dòng)參數(shù);
(3)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的表面物理特性。要達(dá)到的最終目的是實(shí)現(xiàn)對(duì)于三維景物世界的理解,即實(shí)現(xiàn)人的視覺(jué)系統(tǒng)的某些功能。也就是利用二維投影圖像來(lái)重構(gòu)三維物體的可視部分。
3.1計(jì)算機(jī)視覺(jué)研究的對(duì)象與方法
3.1.1以模型世界為主要對(duì)象的視覺(jué)基本方法研究
這個(gè)階段以Roberts的開(kāi)創(chuàng)性工作為標(biāo)志。在Roberts的工作中引入了三維物體與二維成像的關(guān)系,采用了一些簡(jiǎn)單的邊緣特征提取方法并引入了組合線段的方法。這些早期的工作對(duì)視覺(jué)的發(fā)展起了促進(jìn)作用,但對(duì)于稍微復(fù)雜的景物便難于奏效。
為他對(duì)三維關(guān)系的分析僅僅是靠簡(jiǎn)單的邊緣線段的約束關(guān)系,并沒(méi)有充分考慮人類或其他動(dòng)物視覺(jué)系統(tǒng)感知三維空間關(guān)系的方式。
3.1.2以計(jì)算理論為核心的視覺(jué)模型研究
20世紀(jì)70年代開(kāi)始,對(duì)計(jì)算機(jī)視覺(jué)的研究進(jìn)入更為理性化的階段,主要集中于各種本征特性的恢復(fù),包括三維形狀、運(yùn)動(dòng)、光源等的恢復(fù)。主要出發(fā)點(diǎn)是從生理學(xué)、光學(xué)和射影幾何的方法出發(fā),研究成像及其逆問(wèn)題。在這一階段中,以Marr為代表的一些研究者提出了以表示為核心、以算法為中間轉(zhuǎn)換過(guò)程的一般性視覺(jué)處理模型。在其理論中強(qiáng)調(diào)表示的重要性以及從不同層次上去研究信息處理問(wèn)題,在計(jì)算理論和算法實(shí)現(xiàn)上又特別強(qiáng)調(diào)計(jì)算理論的重要性。在三維信息的感知方面,根據(jù)人類感知深度的不同提出了一系列ShapefromX的方法。
3.2計(jì)算機(jī)視覺(jué)的應(yīng)用領(lǐng)域
計(jì)算機(jī)視覺(jué)的應(yīng)用領(lǐng)域主要包括對(duì)照片、視頻資料如航空照片、衛(wèi)星照片、視頻片段等的解釋、精確制導(dǎo)、移動(dòng)機(jī)器人視覺(jué)導(dǎo)航、醫(yī)學(xué)輔助診斷、工業(yè)機(jī)器人的手眼系統(tǒng)、地圖繪制、物體三維形狀分析與識(shí)別及智能人機(jī)接口等。
早期進(jìn)行數(shù)字圖像處理的目的之一就是要通過(guò)采用數(shù)字技術(shù)提高照片的質(zhì)量,輔助進(jìn)行航空照片和衛(wèi)星照片的讀取判別與分類。由于需要判讀的照片數(shù)量很多,于是希望有自動(dòng)的視覺(jué)系統(tǒng)進(jìn)行判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛(wèi)星照片判讀系統(tǒng)與方法。自動(dòng)判讀的進(jìn)一步應(yīng)用就是直接確定目標(biāo)的性質(zhì),進(jìn)行實(shí)時(shí)的自動(dòng)分類,并與制導(dǎo)系統(tǒng)相結(jié)合。目前常用的制導(dǎo)方式包括激光制導(dǎo)、電視制導(dǎo)和圖像制導(dǎo),在導(dǎo)彈系統(tǒng)中常常將慣性制導(dǎo)與圖像制導(dǎo)結(jié)合,利用圖像進(jìn)行精確的末制導(dǎo)。
工業(yè)機(jī)器人的手眼系統(tǒng)是計(jì)算機(jī)視覺(jué)應(yīng)用最為成功的領(lǐng)域之一,由于工業(yè)現(xiàn)場(chǎng)的諸多因素,如光照條件、成像方向均是可控的,因此使得問(wèn)題大為簡(jiǎn)化,有利于構(gòu)成實(shí)際的系統(tǒng)。與工業(yè)機(jī)器人不同,對(duì)于移動(dòng)機(jī)器人而言,由于它具有行為能力,于是就必須解決行為規(guī)劃問(wèn)題,即是對(duì)環(huán)境的了解。隨著移動(dòng)式機(jī)器人的發(fā)展,越來(lái)越多地要求提供視覺(jué)能力,包括道路跟蹤、回避障礙、特定目標(biāo)識(shí)別等。目前移動(dòng)機(jī)器人視覺(jué)系統(tǒng)研究仍處于實(shí)驗(yàn)階段,大多采用遙控和遠(yuǎn)視方法。
在醫(yī)學(xué)上采用的圖像處理技術(shù)大致包括壓縮、存儲(chǔ)、傳輸和自動(dòng)/輔助分類判讀,此外還可用于醫(yī)生的輔助訓(xùn)練手段。與計(jì)算機(jī)視覺(jué)相關(guān)的工作包括分類、判讀和快速三維結(jié)構(gòu)的重建等方面。長(zhǎng)期以來(lái),地圖繪制是一件耗費(fèi)人力、物力和時(shí)間的工作。以往的做法是人工測(cè)量,現(xiàn)在更多的是利用航測(cè)加上立體視覺(jué)中恢復(fù)三維形狀的方法繪制地圖,大大提高了地圖繪制的效率。同時(shí),通用物體三維形狀分析與識(shí)別一直是計(jì)算機(jī)視覺(jué)的重要研究目標(biāo),并在景物的特征提取、表示、知識(shí)的存儲(chǔ)、檢索以及匹配識(shí)別等方面都取得了一定的進(jìn)展,構(gòu)成了一些用于三維景物分析的系統(tǒng)。
近年來(lái),基于生物特征(biometrics)的鑒別技術(shù)得到了廣泛重視,主要集中在對(duì)人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺(jué)信息有關(guān)。與生物特征識(shí)別密切相關(guān)的另一個(gè)重要應(yīng)用是用于構(gòu)成智能人機(jī)接口?,F(xiàn)在計(jì)算機(jī)與人的交流還是機(jī)械式的,計(jì)算機(jī)無(wú)法識(shí)別用戶的真實(shí)身份,除鍵盤、鼠標(biāo)外,其他輸入手段還不成熟。利用計(jì)算機(jī)視覺(jué)技術(shù)可以使計(jì)算機(jī)檢測(cè)到用戶是否存在、鑒別用戶身份、識(shí)別用戶的體勢(shì)(如點(diǎn)頭、搖頭)。此外,這種人機(jī)交互方式還可推廣到一切需要人機(jī)交互的場(chǎng)合,如入口安全控制、過(guò)境人員的驗(yàn)放等。
4對(duì)計(jì)算機(jī)視覺(jué)研究的認(rèn)識(shí)
計(jì)算機(jī)視覺(jué)研究經(jīng)歷了近40年的過(guò)程,仍面臨許多問(wèn)題。主要由于這一方向是多學(xué)科的交叉與結(jié)合,同時(shí)視覺(jué)是一個(gè)涉及生理、心理的復(fù)雜過(guò)程,不僅與眼睛有關(guān),還和大腦的推理、學(xué)習(xí)有關(guān)。研究計(jì)算機(jī)視覺(jué)的目的是要實(shí)現(xiàn)對(duì)人類視覺(jué)的模擬和延伸。對(duì)于人類而言,視覺(jué)是一個(gè)輕而易舉的功能,對(duì)機(jī)器卻不同。視覺(jué)過(guò)程很難用類似于問(wèn)題求解的方法符號(hào)化。隨著計(jì)算機(jī)科學(xué)領(lǐng)域中對(duì)定量研究的重視,這種狀況會(huì)得到改善。在計(jì)算機(jī)視覺(jué)的研究過(guò)程中,應(yīng)考慮將功能模擬與認(rèn)知模擬相結(jié)合。人類延伸其他能力的過(guò)程中,功能模擬起到了主要作用,但視覺(jué)是涉及心理和生理兩方面的過(guò)程,因此必須在功能模擬的同時(shí)重視認(rèn)知模擬。
計(jì)算理論的進(jìn)步與感知手段的改進(jìn)有助于計(jì)算機(jī)視覺(jué)的研究。在計(jì)算機(jī)視覺(jué)中計(jì)算理論占有十分重要的地位,計(jì)算理論的進(jìn)步,新的計(jì)算模型的提出可以解決以往一些困難的問(wèn)題;另一方面,感知手段的進(jìn)步也可以起到同樣的作用。采用主動(dòng)視覺(jué)可從另一個(gè)側(cè)面去處理面對(duì)的視覺(jué)問(wèn)題。要實(shí)現(xiàn)完整的視覺(jué)系統(tǒng),視覺(jué)知識(shí)的獲取、管理和利用是必不可少的。一個(gè)相對(duì)完備的視覺(jué)系統(tǒng)同時(shí)也是一個(gè)知識(shí)管理系統(tǒng),在視覺(jué)過(guò)程中對(duì)一幅圖像的理解需要大量的關(guān)于任務(wù)領(lǐng)域的知識(shí),這些知識(shí)不同于問(wèn)題求解中的知識(shí)可以明確的顯性表示,而且人類獲取信息的80%是通過(guò)視覺(jué)得到的,因而這些知識(shí)涉及面之廣難以預(yù)測(cè),因此視覺(jué)系統(tǒng)中的知識(shí)管理是一個(gè)重要問(wèn)題。
從以往的研究看,過(guò)去的幾十年雖然提出、解決了一些問(wèn)題,但是由于視覺(jué)問(wèn)題的特殊性和復(fù)雜性,還有大量的問(wèn)題需要研究。研究的重點(diǎn)包括對(duì)新方法、新手段的探索。當(dāng)然,在原有問(wèn)題上采用新的描述方法、求解手段也是一個(gè)可能的突破點(diǎn)。在視覺(jué)領(lǐng)域中多數(shù)的問(wèn)題不是問(wèn)題本身正確與否,而是描述是否恰當(dāng)以及求解是否有效的問(wèn)題,因而描述方式、求解手段的探索是十分重要的??傊?隨著對(duì)定量研究的重視,新的描述方式、求解手段的研究,以及感知手段的改進(jìn),計(jì)算機(jī)視覺(jué)的研究必將迎來(lái)一個(gè)更加繁榮的時(shí)代。
參考文獻(xiàn):
[1]陳熙霖.計(jì)算機(jī)視覺(jué):算法與系統(tǒng)原理,清華大學(xué)出版社,2000
[2]高滿屯.計(jì)算機(jī)視覺(jué)研究中的投影理論和方法,西北工業(yè)大學(xué)出版社,1998
[3]馬頌德,張正友.計(jì)算機(jī)視覺(jué)—計(jì)算理論與算法基礎(chǔ),科學(xué)出版社,1998
[4]章毓晉.圖像工程下-圖像理解與計(jì)算機(jī)視覺(jué),清華大學(xué)出版社,2000
[5] (美)福賽思.計(jì)算機(jī)視覺(jué):一種現(xiàn)代方法,電子工業(yè)出版社,2004