本文相關(guān)
-
Paper Summary:https://github.com/FDU-VTS/CVPaper -
Code:https://github.com/FDU-VTS/CVCode
原文鏈接
基礎(chǔ)知識(shí)
- 一張圖是由不同的像素點(diǎn)構(gòu)成的,本文的計(jì)算和構(gòu)建都是基于像素點(diǎn)的運(yùn)算,即
(RGB)值 - 高斯模糊/拉普拉斯變換:用于轉(zhuǎn)換圖像,減少圖像噪聲的平滑算法
- 最小生成樹
(Minimum Spanning Tree | MST)指的是,在圖中建立一個(gè)連通圖并且沒有回路是生成樹,而最小生成樹指的是構(gòu)成結(jié)果權(quán)值最小 - 不同像素點(diǎn)之間的差:即
RGB值之間的歐氏距離 - 并查集算法(union find set)以及克魯斯卡爾算法(Kruskal),使用邊建立并查集,并且使用kruskal進(jìn)行搜索合并
早期的分割方法
- Zahn提出了一種基于圖的最小生成樹(MST)的分割方法,用來進(jìn)行點(diǎn)聚類以及圖像分割,前者權(quán)值是點(diǎn)間距離,后者權(quán)值是像素差異。
- 不足:根據(jù)閾值不同,會(huì)導(dǎo)致高可變性(大約是色彩對(duì)比強(qiáng)的一個(gè)區(qū)域)區(qū)域劃分為多個(gè)區(qū)域;將ramp和constant region合并到一起。
- Urquhart提出用邊相連的點(diǎn)中邊權(quán)值最小的進(jìn)行歸一化,找周圍相似的。
- 根據(jù)各個(gè)區(qū)域是否符合某種均勻性標(biāo)準(zhǔn)來分割,找均勻強(qiáng)度或梯度的區(qū)域,不適用于某個(gè)變化很大的區(qū)域。
- 使用特征空間聚類:通過平滑數(shù)據(jù)——給定半徑的超球面對(duì)各個(gè)點(diǎn)擴(kuò)張其連通分量,找到簇,來保持該區(qū)域的邊界,并對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換。
基于圖的分割
定義
-
G:將圖像由像素點(diǎn)轉(zhuǎn)化為圖 -
V:每一個(gè)像素點(diǎn)都是圖中的點(diǎn) -
E:任意兩個(gè)相鄰像素點(diǎn)之間邊 -
C:被劃分的Segmentation,一個(gè)C中有至少1個(gè)像素點(diǎn) -
Int(C):區(qū)域內(nèi)最小生成樹權(quán)值最大的邊,表示的是,記為 -
Dif(C1,C2):表示C1和C2之間的距離,記為 - 最后要形成的分組要求是(表示了所有區(qū)域之間的最小距離都比區(qū)域內(nèi)的最大距離和權(quán)值的和要大)
- 其中
MInt(C1,C2)的值為: - 閾值設(shè)定的原因是為了在開始時(shí),因?yàn)橹挥袉蝹€(gè)像素點(diǎn),那么點(diǎn)內(nèi)的距離為0,而點(diǎn)之間的距離還存在,那么導(dǎo)致無法合并。所以加入閾值。
分割算法(與克魯斯卡爾算法構(gòu)建最小生成樹有密切關(guān)系。)
- 輸入是一個(gè)有n個(gè)節(jié)點(diǎn)和m條邊的圖G,輸出是一系列區(qū)域。步驟如下:
- 0.將邊按照權(quán)重值以非遞減方式排序
- 1.最初的分割記為S(0),即每一個(gè)節(jié)點(diǎn)屬于一個(gè)區(qū)域。
- 2.按照以下的方式由S(q-1)構(gòu)造S(q):記第q條邊連接的兩個(gè)節(jié)點(diǎn)為vi和vj,如果在S(q-1)中vi和vj是分別屬于兩個(gè)區(qū)域并且第q條邊的權(quán)重小于兩個(gè)區(qū)域的區(qū)域內(nèi)間距,則合并兩個(gè)區(qū)域。否則令S(q) = S(q-1)。
- 3.從q=1到q=m,重復(fù)步驟2。
- 4.返回S(m)即為所求分割區(qū)域集合。
補(bǔ)充
高斯濾波器
- 高斯變換就是用高斯函數(shù)對(duì)圖像進(jìn)行卷積,高斯濾波器是一種線性濾波器,能夠有效抑制噪聲,并平滑圖像。其實(shí)質(zhì)是取濾波器窗口內(nèi)像素的均值作為輸出。
- 高斯函數(shù)公式如下:
-
其中,u是x的均值,σ是方差。
-
- 由一維函數(shù),我們可以推導(dǎo)出二維函數(shù)的公式如下:
- 高斯函數(shù)在圖像處理中的使用,實(shí)際上就是對(duì)每個(gè)像素點(diǎn)的周邊像素取平均值,從而達(dá)到平滑的效果,在取值(周邊半徑)時(shí),周圍像素點(diǎn)的半徑越大,則圖像的模糊度就越強(qiáng)。在實(shí)際計(jì)算時(shí),利用高斯模糊按正態(tài)曲線分配周邊像素的權(quán)重,從而求中心點(diǎn)的加權(quán)平均值。
- 高斯模糊的具體計(jì)算方式如下:
- 1.將中心點(diǎn)周圍的八個(gè)點(diǎn)帶入到高斯函數(shù)中,從而得到權(quán)重矩陣A1;
- 2.為使歸一化,將矩陣A1中的各個(gè)點(diǎn)除以所有點(diǎn)(9個(gè)點(diǎn))的權(quán)重和,得到歸一化后的權(quán)重矩陣A2;
- 3.圖片原始的像素矩陣分別乘以A2中各自的權(quán)重值,將得到的所有點(diǎn)的值加起來求平均,便得到中心點(diǎn)的高斯模糊值。圖像中其余點(diǎn)相同求法。
- 注:1.彩色圖片,可對(duì)RGB三通道分別作高斯模糊。
- 2.
σ代表數(shù)據(jù)的離散程度,σ越大,中心系數(shù)越小,圖像越平滑;反之,反之。
拉普拉斯變換:是為解決傅立葉變換等幅振蕩的缺點(diǎn)。
- 首先了解一下傅立葉變換:傅立葉變換是一種物理上探究頻譜的方法,三角公式是:
- 其中,
w0表示基波。
- 由歐拉公式:
- 將傅立葉三角形式公式中的正余弦函數(shù)用指數(shù)函數(shù)表示,改寫為用復(fù)指數(shù)表示的公式,如下:
- 將上述公式改為積分形式,即得到復(fù)指數(shù)形式公式為:
- 但由于傅立葉變換是等幅振蕩的正弦波,故當(dāng)f(t)不斷趨向無窮時(shí),此時(shí)函數(shù)將不再收斂,這時(shí)候便不再適合使用傅立葉變換。于是,我們引入一個(gè)衰減因子,對(duì)其作變換。對(duì)函數(shù)y=f(t)乘上一個(gè)
,其中,
σ>0。 - 對(duì)上式進(jìn)行合并同類項(xiàng),可得到
- 我們將指數(shù)中的
σ+jw最初的分割記為S,于是得到拉普拉斯公式:-
??
-
- 由上式推導(dǎo),很清楚的知道,當(dāng)s=jw時(shí),拉普拉斯函數(shù)就變成了傅立葉函數(shù),也就相當(dāng)于拉氏不再具有衰減功能。
- 又由上述公式可以很直觀地看到當(dāng)取值
剛好收斂時(shí),則
>
的區(qū)域全都收斂。