計算機(jī)視覺基本任務(wù)研究目標(biāo)

計算機(jī)視覺(Computer Vision)是研究如何使機(jī)器“看”的科學(xué),即用攝像機(jī)和計算機(jī)代替人眼對目標(biāo)進(jìn)行識別、跟蹤、測量等任務(wù)。其與機(jī)器視覺的區(qū)別在于:計算機(jī)視覺側(cè)重對質(zhì)的分析,如分類識別,這是貓還是狗;或進(jìn)行身份確認(rèn),如車牌識別、人臉識別;或進(jìn)行行為分析,如人群聚集等;而機(jī)器視覺側(cè)重對量的分析,如通過視覺去測量零件的直徑。計算機(jī)視覺的基本任務(wù)包括:圖像分類、目標(biāo)定位、目標(biāo)檢測、圖像分割等。

圖像分類(Image Classification):圖像分類任務(wù)的目標(biāo)是輸出給定的圖像是什么類別的問題,如回答這是一張貓的圖像的問題;

目標(biāo)定位(Object Localization):目標(biāo)定位任務(wù)的目標(biāo)是找到圖像中某一類別的物體在圖像中的位置,輸出bounding box;即不僅要識別出是什么類別的物體(類標(biāo)簽),還要給出物體的位置,位置用bounding box標(biāo)記。 目標(biāo)定位通常是針對單個物體的。

目標(biāo)檢測(Object Detection):目標(biāo)檢測任務(wù)包含分類和目標(biāo)定位,目標(biāo)是用多個bounding box分別把多個物體的位置標(biāo)記出來,并分別給出物體對應(yīng)的類別。目標(biāo)檢測通常是多個物體的定位任務(wù)。即不僅要識別圖像中的阿貓阿狗,還要給出阿貓阿狗的位置。

圖像分割(Image Segmentation):圖像分割任務(wù)的目標(biāo)是將圖像細(xì)分為多個具有相似性質(zhì)且不相交的區(qū)域,是對圖像中的每一個像素加標(biāo)簽的過程,即像素級的分割。圖像分割任務(wù)主要有語義分割(Semantic Segmentation)和實例分割(Instance Segmentation)兩種。語義分割的目標(biāo)是將輸入圖像分為不同語義可解釋的類別(語義的可解釋性即分類類別在真是世界中是有意義的),每一個像素點都要判斷其類別,是像素級別的分割。注意語義分割值判斷類別不區(qū)分個體,例如語義分割將圖像中屬于汽車的所有像素標(biāo)記為藍(lán)色,對于圖像中有兩個藍(lán)色的像素,無法區(qū)分他們是屬于同一個還是不同的汽車。實例分割的目的是確定圖像中存在的興趣目標(biāo)位置和類別,機(jī)器自動從圖像中用目標(biāo)檢測方法框出不同實例,再用語義分割方法在不同實例區(qū)域內(nèi)進(jìn)行逐像素標(biāo)記。實例分割是目標(biāo)檢測和語義分割的結(jié)合,但又不同于目標(biāo)檢測和語義分割。相對物體檢測的邊界框,實例分割可精確到物體的邊緣;相對語義分割,實例分割可以標(biāo)注出圖上同一物體的不同個體,即哪些像素屬于第一輛汽車,哪些像素屬于第二輛汽車。最后,還有一個全景分割,它是語義分割和實例分割的結(jié)合。即每個像素都被分為一類,如果一種類別里有多個實例,會用不同的顏色進(jìn)行區(qū)分,就知道哪個像素屬于哪個類中的哪個實例。

注:上述任務(wù)中,最基本的是分類任務(wù),其他任務(wù)都可在分類任務(wù)的基礎(chǔ)上,通過一些技術(shù)手段解決,例如在圖片中加入很多窗口,提取每一個窗口的特征,然后預(yù)測分類,并將分類一樣并相鄰的窗口合并,就成了目標(biāo)定位和目標(biāo)檢測。


本文內(nèi)容參考資料:

http://www.itdecent.cn/p/45acc16c6a94

https://blog.csdn.net/qq_39295044/article/details/79796663

https://zhuanlan.zhihu.com/p/50996404

https://blog.csdn.net/niaolianjiulin/article/details/52948274

https://zhuanlan.zhihu.com/p/39272659

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容