Efficient Graph-Based Image Segmentation

本文相關(guān)

原文鏈接

基礎(chǔ)知識(shí)

  • 一張圖是由不同的像素點(diǎn)構(gòu)成的,本文的計(jì)算和構(gòu)建都是基于像素點(diǎn)的運(yùn)算,即(RGB)
  • 高斯模糊/拉普拉斯變換:用于轉(zhuǎn)換圖像,減少圖像噪聲的平滑算法
  • 最小生成樹(Minimum Spanning Tree | MST)指的是,在圖中建立一個(gè)連通圖并且沒有回路是生成樹,而最小生成樹指的是構(gòu)成結(jié)果權(quán)值最小
  • 不同像素點(diǎn)之間的差:即RGB值之間的歐氏距離
    • \sqrt{(R_1-R_2)^2+(G_1-G_2)^2+(B_1-B_2)^2}
  • 并查集算法(union find set)以及克魯斯卡爾算法(Kruskal),使用邊建立并查集,并且使用kruskal進(jìn)行搜索合并

早期的分割方法

  • Zahn提出了一種基于圖的最小生成樹(MST)的分割方法,用來進(jìn)行點(diǎn)聚類以及圖像分割,前者權(quán)值是點(diǎn)間距離,后者權(quán)值是像素差異。
  • 不足:根據(jù)閾值不同,會(huì)導(dǎo)致高可變性(大約是色彩對(duì)比強(qiáng)的一個(gè)區(qū)域)區(qū)域劃分為多個(gè)區(qū)域;將ramp和constant region合并到一起。
  • Urquhart提出用邊相連的點(diǎn)中邊權(quán)值最小的進(jìn)行歸一化,找周圍相似的。
  • 根據(jù)各個(gè)區(qū)域是否符合某種均勻性標(biāo)準(zhǔn)來分割,找均勻強(qiáng)度或梯度的區(qū)域,不適用于某個(gè)變化很大的區(qū)域。
  • 使用特征空間聚類:通過平滑數(shù)據(jù)——給定半徑的超球面對(duì)各個(gè)點(diǎn)擴(kuò)張其連通分量,找到簇,來保持該區(qū)域的邊界,并對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換。

基于圖的分割

定義

  • G:將圖像由像素點(diǎn)轉(zhuǎn)化為圖
  • V:每一個(gè)像素點(diǎn)都是圖中的點(diǎn)
  • E:任意兩個(gè)相鄰像素點(diǎn)之間邊
  • C:被劃分的Segmentation,一個(gè)C中有至少1個(gè)像素點(diǎn)
  • Int(C):區(qū)域內(nèi)最小生成樹權(quán)值最大的邊,表示的是,記為
    • Int(C) = \max{w(e)} , e∈MST(C,E)
  • Dif(C1,C2):表示C1和C2之間的距離,記為
    • Dif(C1,C2) = \min{w(vi,vj)} ,vi∈C1,vj∈C2,(vi,vj)∈E
  • 最后要形成的分組要求是(表示了所有區(qū)域之間的最小距離都比區(qū)域內(nèi)的最大距離和權(quán)值的和要大)
    • D(C1,C2)=\left\{ \begin{aligned} true, & & \ if Dif(C1,C2)>MInt(C1,C2) \\ false, & & \ otherwise \end{aligned} \right.
  • 其中MInt(C1,C2)的值為:
    • MInt(C1,C2) = (Int(C1)+τ(C1),Int(C2)+τ(C2))
  • 閾值設(shè)定的原因是為了在開始時(shí),因?yàn)橹挥袉蝹€(gè)像素點(diǎn),那么點(diǎn)內(nèi)的距離為0,而點(diǎn)之間的距離還存在,那么導(dǎo)致無法合并。所以加入閾值。
    • τ(C) = k/|C|

分割算法(與克魯斯卡爾算法構(gòu)建最小生成樹有密切關(guān)系。)

  • 輸入是一個(gè)有n個(gè)節(jié)點(diǎn)和m條邊的圖G,輸出是一系列區(qū)域。步驟如下:
  • 0.將邊按照權(quán)重值以非遞減方式排序
  • 1.最初的分割記為S(0),即每一個(gè)節(jié)點(diǎn)屬于一個(gè)區(qū)域。
  • 2.按照以下的方式由S(q-1)構(gòu)造S(q):記第q條邊連接的兩個(gè)節(jié)點(diǎn)為vi和vj,如果在S(q-1)中vi和vj是分別屬于兩個(gè)區(qū)域并且第q條邊的權(quán)重小于兩個(gè)區(qū)域的區(qū)域內(nèi)間距,則合并兩個(gè)區(qū)域。否則令S(q) = S(q-1)。
  • 3.從q=1到q=m,重復(fù)步驟2。
  • 4.返回S(m)即為所求分割區(qū)域集合。

補(bǔ)充

高斯濾波器

  • 高斯變換就是用高斯函數(shù)對(duì)圖像進(jìn)行卷積,高斯濾波器是一種線性濾波器,能夠有效抑制噪聲,并平滑圖像。其實(shí)質(zhì)是取濾波器窗口內(nèi)像素的均值作為輸出。
  • 高斯函數(shù)公式如下:
    • f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{ -\frac{(x-\mu)^2}{2\sigma^2}}
      其中,ux的均值,σ是方差。
  • 由一維函數(shù),我們可以推導(dǎo)出二維函數(shù)的公式如下:
    • f(x,y) = \frac{1}{2\pi \sigma^2} e^{-\frac{(x^2+y^2)}{2\sigma^2} }
  • 高斯函數(shù)在圖像處理中的使用,實(shí)際上就是對(duì)每個(gè)像素點(diǎn)的周邊像素取平均值,從而達(dá)到平滑的效果,在取值(周邊半徑)時(shí),周圍像素點(diǎn)的半徑越大,則圖像的模糊度就越強(qiáng)。在實(shí)際計(jì)算時(shí),利用高斯模糊按正態(tài)曲線分配周邊像素的權(quán)重,從而求中心點(diǎn)的加權(quán)平均值。
  • 高斯模糊的具體計(jì)算方式如下:
    • 1.將中心點(diǎn)周圍的八個(gè)點(diǎn)帶入到高斯函數(shù)中,從而得到權(quán)重矩陣A1;
    • 2.為使歸一化,將矩陣A1中的各個(gè)點(diǎn)除以所有點(diǎn)(9個(gè)點(diǎn))的權(quán)重和,得到歸一化后的權(quán)重矩陣A2;
    • 3.圖片原始的像素矩陣分別乘以A2中各自的權(quán)重值,將得到的所有點(diǎn)的值加起來求平均,便得到中心點(diǎn)的高斯模糊值。圖像中其余點(diǎn)相同求法。
    • 注:1.彩色圖片,可對(duì)RGB三通道分別作高斯模糊。
  • 2.σ代表數(shù)據(jù)的離散程度,σ越大,中心系數(shù)越小,圖像越平滑;反之,反之。

拉普拉斯變換:是為解決傅立葉變換等幅振蕩的缺點(diǎn)。

  • 首先了解一下傅立葉變換:傅立葉變換是一種物理上探究頻譜的方法,三角公式是:
    • f(t) = \sum_{n=1}^\infty A_ncos(nw_0t+\varphi_n)+B
    • 其中,w0表示基波。
  • 由歐拉公式:
    • \left\{ \begin{aligned} e^{ix} =cosx+isinx, \\ e^{-ix} =cosx -isinx, \end{aligned} \right.
  • 將傅立葉三角形式公式中的正余弦函數(shù)用指數(shù)函數(shù)表示,改寫為用復(fù)指數(shù)表示的公式,如下:
    • f(t) = \sum_{-\infty}^\infty F(nw_0)e^{jw_0t}
  • 將上述公式改為積分形式,即得到復(fù)指數(shù)形式公式為:
    • F(w) =\int_{-\infty}^\infty f(t)e^{-jwt}dt
  • 但由于傅立葉變換是等幅振蕩的正弦波,故當(dāng)f(t)不斷趨向無窮時(shí),此時(shí)函數(shù)將不再收斂,這時(shí)候便不再適合使用傅立葉變換。于是,我們引入一個(gè)衰減因子,對(duì)其作變換。對(duì)函數(shù)y=f(t)乘上一個(gè)e^{\sigma t},其中,σ>0。
    • F(w) =\int_{-\infty}^\infty f(t)e^{-\sigma t}e^{-jwt}dt
  • 對(duì)上式進(jìn)行合并同類項(xiàng),可得到F(w) =\int_{-\infty}^\infty f(t)e^{-t(\sigma+jw)}dt
  • 我們將指數(shù)中的σ+jw最初的分割記為S,于是得到拉普拉斯公式:
    • \Rightarrow??F(w) =\int_{-\infty}^\infty f(t)e^{-st}dt
  • 由上式推導(dǎo),很清楚的知道,當(dāng)s=jw時(shí),拉普拉斯函數(shù)就變成了傅立葉函數(shù),也就相當(dāng)于拉氏不再具有衰減功能。
  • 又由上述公式可以很直觀地看到當(dāng)取值\sigma_0剛好收斂時(shí),則\sigma>\sigma_0的區(qū)域全都收斂。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容