文章摘選自多篇文章,僅用于學(xué)習(xí),在此表示感謝,若有侵權(quán)請(qǐng)聯(lián)系,感謝
SIFT
https://blog.csdn.net/lingyunxianhe/article/details/79063547
????????尺度不變特征轉(zhuǎn)換即SIFT (Scale-invariant?feature?transform)是一種計(jì)算機(jī)視覺(jué)的算法。它用來(lái)偵測(cè)與描述影像中的局部性特征,它在空間尺度中尋找極值點(diǎn),并提取出其位置、尺度、旋轉(zhuǎn)不變量。局部影像特征的描述與偵測(cè)可以幫助辨識(shí)物體,SIFT特征是基于物體上的一些局部外觀的興趣點(diǎn)而與影像的大小和旋轉(zhuǎn)無(wú)關(guān)。對(duì)于光線、噪聲、些微視角改變的容忍度也相當(dāng)高。
????SIFT算法的實(shí)質(zhì)是在不同的尺度空間上查找關(guān)鍵點(diǎn)(特征點(diǎn)),并計(jì)算出關(guān)鍵點(diǎn)的方向。SIFT所查找到的關(guān)鍵點(diǎn)是一些十分突出,不會(huì)因光照,仿射變換和噪音等因素而變化的點(diǎn),如角點(diǎn)、邊緣點(diǎn)、暗區(qū)的亮點(diǎn)及亮區(qū)的暗點(diǎn)等。

方向梯度直方圖(Histogram of Oriented Gradient, HOG)
????在一副圖像中,局部目標(biāo)的表象和形狀(appearance and shape)能夠被梯度或邊緣的方向密度分布很好地描述。首先將圖像分成小的連通區(qū)域,我們把它叫細(xì)胞單元。然后采集細(xì)胞單元中各像素點(diǎn)的梯度的或邊緣的方向直方圖。最后把這些直方圖組合起來(lái)就可以構(gòu)成特征描述器。
大概過(guò)程:
HOG特征提取方法就是將一個(gè)image(你要檢測(cè)的目標(biāo)或者掃描窗口):
1)灰度化(將圖像看做一個(gè)x,y,z(灰度)的三維圖像);
2)采用Gamma校正法對(duì)輸入圖像進(jìn)行顏色空間的標(biāo)準(zhǔn)化(歸一化);目的是調(diào)節(jié)圖像的對(duì)比度,降低圖像局部的陰影和光照變化所造成的影響,同時(shí)可以抑制噪音的干擾;
3)計(jì)算圖像每個(gè)像素的梯度(包括大小和方向);主要是為了捕獲輪廓信息,同時(shí)進(jìn)一步弱化光照的干擾。
4)將圖像劃分成小cells(例如6*6像素/cell);
5)統(tǒng)計(jì)每個(gè)cell的梯度直方圖(不同梯度的個(gè)數(shù)),即可形成每個(gè)cell的descriptor;
6)將每幾個(gè)cell組成一個(gè)block(例如3*3個(gè)cell/block),一個(gè)block內(nèi)所有cell的特征descriptor串聯(lián)起來(lái)便得到該block的HOG特征descriptor。
7)將圖像image內(nèi)的所有block的HOG特征descriptor串聯(lián)起來(lái)就可以得到該image(你要檢測(cè)的目標(biāo))的HOG特征descriptor了。這個(gè)就是最終的可供分類使用的特征向量了。
LBP
????LBP(Local Binary Pattern,局部二值模式)是一種用來(lái)描述圖像局部紋理特征的算子;它具有旋轉(zhuǎn)不變性和灰度不變性等顯著的優(yōu)點(diǎn)。原始的LBP算子定義為在3*3的窗口內(nèi),以窗口中心像素為閾值,將相鄰的8個(gè)像素的灰度值與其進(jìn)行比較,若周圍像素值大于中心像素值,則該像素點(diǎn)的位置被標(biāo)記為1,否則為0。這樣,3*3鄰域內(nèi)的8個(gè)點(diǎn)經(jīng)比較可產(chǎn)生8位二進(jìn)制數(shù)(通常轉(zhuǎn)換為十進(jìn)制數(shù)即LBP碼,共256種),即得到該窗口中心像素點(diǎn)的LBP值,并用這個(gè)值來(lái)反映該區(qū)域的紋理信息。
提取的步驟
(1)首先將檢測(cè)窗口劃分為16×16的小區(qū)域(cell);
(2)對(duì)于每個(gè)cell中的一個(gè)像素,將相鄰的8個(gè)像素的灰度值與其進(jìn)行比較,若周圍像素值大于中心像素值,則該像素點(diǎn)的位置被標(biāo)記為1,否則為0。這樣,3*3鄰域內(nèi)的8個(gè)點(diǎn)經(jīng)比較可產(chǎn)生8位二進(jìn)制數(shù),即得到該窗口中心像素點(diǎn)的LBP值;
(3)然后計(jì)算每個(gè)cell的直方圖,即每個(gè)數(shù)字(假定是十進(jìn)制數(shù)LBP值)出現(xiàn)的頻率;然后對(duì)該直方圖進(jìn)行歸一化處理。
(4)最后將得到的每個(gè)cell的統(tǒng)計(jì)直方圖進(jìn)行連接成為一個(gè)特征向量,也就是整幅圖的LBP紋理特征向量;
Haar
????Haar特征分為三類:邊緣特征、線性特征、中心特征和對(duì)角線特征,組合成特征模板。特征模板內(nèi)有白色和黑色兩種矩形,并定義該模板的特征值為白色矩形像素和減去黑色矩形像素和。Haar特征值反映了圖像的灰度變化情況。例如:臉部的一些特征能由矩形特征簡(jiǎn)單的描述,如:眼睛要比臉頰顏色要深,鼻梁兩側(cè)比鼻梁顏色要深,嘴巴比周圍顏色要深等。但矩形特征只對(duì)一些簡(jiǎn)單的圖形結(jié)構(gòu),如邊緣、線段較敏感,所以只能描述特定走向(水平、垂直、對(duì)角)的結(jié)構(gòu)。通過(guò)改變特征模板的大小和位置,可在圖像子窗口中窮舉出大量的特征。特征模板稱為“特征原型”;特征原型在圖像子窗口中擴(kuò)展(平移伸縮)得到的特征稱為“矩形特征”;矩形特征的值稱為“特征值”。
????矩形特征可位于圖像任意位置,大小也可以任意改變,所以矩形特征值是矩形模版類別、矩形位置和矩形大小這三個(gè)因素的函數(shù)。故類別、大小和位置的變化,使得很小的檢測(cè)窗口含有非常多的矩形特征,如:在24*24像素大小的檢測(cè)窗口內(nèi)矩形特征數(shù)量可以達(dá)到16萬(wàn)個(gè)。這樣就有兩個(gè)問(wèn)題需要解決了:(1)如何快速計(jì)算那么多的特征?—積分圖大顯神通;(2)哪些矩形特征才是對(duì)分類器分類最有效的?