超碰在线13,久久人妻一区二区

本文相關(guān)

Paper Summary:https://github.com/FDU-VTS/CVPaper
Code:https://github.com/FDU-VTS/CVCode

原文鏈接

http://www.cs.cornell.edu/~dph/papers/seg-ijcv.pdf

基礎(chǔ)知識(shí)

一張圖是由不同的像素點(diǎn)構(gòu)成的，本文的計(jì)算和構(gòu)建都是基于像素點(diǎn)的運(yùn)算，即(RGB)值
高斯模糊/拉普拉斯變換:用于轉(zhuǎn)換圖像，減少圖像噪聲的平滑算法
最小生成樹(Minimum Spanning Tree | MST)指的是，在圖中建立一個(gè)連通圖并且沒有回路是生成樹，而最小生成樹指的是構(gòu)成結(jié)果權(quán)值最小
不同像素點(diǎn)之間的差:即RGB值之間的歐氏距離
- $\sqrt{(R_1-R_2)^2+(G_1-G_2)^2+(B_1-B_2)^2}$
并查集算法(union find set)以及克魯斯卡爾算法(Kruskal)，使用邊建立并查集，并且使用kruskal進(jìn)行搜索合并

早期的分割方法

Zahn提出了一種基于圖的最小生成樹（MST）的分割方法，用來進(jìn)行點(diǎn)聚類以及圖像分割，前者權(quán)值是點(diǎn)間距離，后者權(quán)值是像素差異。
不足：根據(jù)閾值不同，會(huì)導(dǎo)致高可變性（大約是色彩對(duì)比強(qiáng)的一個(gè)區(qū)域）區(qū)域劃分為多個(gè)區(qū)域；將ramp和constant region合并到一起。
Urquhart提出用邊相連的點(diǎn)中邊權(quán)值最小的進(jìn)行歸一化，找周圍相似的。
根據(jù)各個(gè)區(qū)域是否符合某種均勻性標(biāo)準(zhǔn)來分割，找均勻強(qiáng)度或梯度的區(qū)域，不適用于某個(gè)變化很大的區(qū)域。
使用特征空間聚類：通過平滑數(shù)據(jù)——給定半徑的超球面對(duì)各個(gè)點(diǎn)擴(kuò)張其連通分量，找到簇，來保持該區(qū)域的邊界，并對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換。

基于圖的分割

定義

G:將圖像由像素點(diǎn)轉(zhuǎn)化為圖
V:每一個(gè)像素點(diǎn)都是圖中的點(diǎn)
E:任意兩個(gè)相鄰像素點(diǎn)之間邊
C:被劃分的Segmentation,一個(gè)C中有至少1個(gè)像素點(diǎn)
Int(C):區(qū)域內(nèi)最小生成樹權(quán)值最大的邊，表示的是，記為
- $Int(C) = \max{w(e)} , e∈MST(C，E)$
Dif(C1,C2):表示C1和C2之間的距離，記為
- $Dif(C1,C2) = \min{w(vi,vj)} ,vi∈C1,vj∈C2,(vi,vj)∈E$
最后要形成的分組要求是(表示了所有區(qū)域之間的最小距離都比區(qū)域內(nèi)的最大距離和權(quán)值的和要大)
- $D(C1,C2)=\left\{ \begin{aligned} true, & & \ if Dif(C1,C2)>MInt(C1,C2) \\ false, & & \ otherwise \end{aligned} \right.$
其中MInt(C1,C2)的值為:
- $MInt(C1,C2) = (Int(C1)+τ(C1),Int(C2)+τ(C2))$
閾值設(shè)定的原因是為了在開始時(shí)，因?yàn)橹挥袉蝹€(gè)像素點(diǎn)，那么點(diǎn)內(nèi)的距離為0，而點(diǎn)之間的距離還存在，那么導(dǎo)致無法合并。所以加入閾值。
- $τ(C) = k/|C|$

分割算法（與克魯斯卡爾算法構(gòu)建最小生成樹有密切關(guān)系。）

輸入是一個(gè)有n個(gè)節(jié)點(diǎn)和m條邊的圖G，輸出是一系列區(qū)域。步驟如下：
0.將邊按照權(quán)重值以非遞減方式排序
1.最初的分割記為S（0），即每一個(gè)節(jié)點(diǎn)屬于一個(gè)區(qū)域。
2.按照以下的方式由S(q-1)構(gòu)造S(q)：記第q條邊連接的兩個(gè)節(jié)點(diǎn)為vi和vj，如果在S(q-1)中vi和vj是分別屬于兩個(gè)區(qū)域并且第q條邊的權(quán)重小于兩個(gè)區(qū)域的區(qū)域內(nèi)間距，則合并兩個(gè)區(qū)域。否則令S(q) = S(q-1)。
3.從q=1到q=m，重復(fù)步驟2。
4.返回S(m)即為所求分割區(qū)域集合。

補(bǔ)充

高斯濾波器

高斯變換就是用高斯函數(shù)對(duì)圖像進(jìn)行卷積，高斯濾波器是一種線性濾波器，能夠有效抑制噪聲，并平滑圖像。其實(shí)質(zhì)是取濾波器窗口內(nèi)像素的均值作為輸出。
高斯函數(shù)公式如下:
- $f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{ -\frac{(x-\mu)^2}{2\sigma^2}}$
  其中，u是x的均值,σ是方差。
由一維函數(shù)，我們可以推導(dǎo)出二維函數(shù)的公式如下：
- $f(x,y) = \frac{1}{2\pi \sigma^2} e^{-\frac{(x^2+y^2)}{2\sigma^2} }$
高斯函數(shù)在圖像處理中的使用，實(shí)際上就是對(duì)每個(gè)像素點(diǎn)的周邊像素取平均值，從而達(dá)到平滑的效果，在取值(周邊半徑)時(shí)，周圍像素點(diǎn)的半徑越大，則圖像的模糊度就越強(qiáng)。在實(shí)際計(jì)算時(shí)，利用高斯模糊按正態(tài)曲線分配周邊像素的權(quán)重，從而求中心點(diǎn)的加權(quán)平均值。
高斯模糊的具體計(jì)算方式如下：
- 1.將中心點(diǎn)周圍的八個(gè)點(diǎn)帶入到高斯函數(shù)中，從而得到權(quán)重矩陣A1；
- 2.為使歸一化，將矩陣A1中的各個(gè)點(diǎn)除以所有點(diǎn)(9個(gè)點(diǎn))的權(quán)重和，得到歸一化后的權(quán)重矩陣A2;
- 3.圖片原始的像素矩陣分別乘以A2中各自的權(quán)重值，將得到的所有點(diǎn)的值加起來求平均，便得到中心點(diǎn)的高斯模糊值。圖像中其余點(diǎn)相同求法。
- 注：1.彩色圖片，可對(duì)RGB三通道分別作高斯模糊。
2.σ代表數(shù)據(jù)的離散程度，σ越大，中心系數(shù)越小，圖像越平滑；反之，反之。

拉普拉斯變換：是為解決傅立葉變換等幅振蕩的缺點(diǎn)。

首先了解一下傅立葉變換：傅立葉變換是一種物理上探究頻譜的方法，三角公式是：
- $f(t) = \sum_{n=1}^\infty A_ncos(nw_0t+\varphi_n)+B$
- 其中,w0表示基波。
由歐拉公式：
- $\left\{ \begin{aligned} e^{ix} =cosx+isinx, \\ e^{-ix} =cosx -isinx, \end{aligned} \right.$
將傅立葉三角形式公式中的正余弦函數(shù)用指數(shù)函數(shù)表示，改寫為用復(fù)指數(shù)表示的公式，如下：
- $f(t) = \sum_{-\infty}^\infty F(nw_0)e^{jw_0t}$
將上述公式改為積分形式，即得到復(fù)指數(shù)形式公式為：
- $F(w) =\int_{-\infty}^\infty f(t)e^{-jwt}dt$
但由于傅立葉變換是等幅振蕩的正弦波，故當(dāng)f(t)不斷趨向無窮時(shí)，此時(shí)函數(shù)將不再收斂，這時(shí)候便不再適合使用傅立葉變換。于是，我們引入一個(gè)衰減因子，對(duì)其作變換。對(duì)函數(shù)y=f(t)乘上一個(gè),其中，σ>0。
- $F(w) =\int_{-\infty}^\infty f(t)e^{-\sigma t}e^{-jwt}dt$
對(duì)上式進(jìn)行合并同類項(xiàng)，可得到 $F(w) =\int_{-\infty}^\infty f(t)e^{-t(\sigma+jw)}dt$
我們將指數(shù)中的σ+jw最初的分割記為S，于是得到拉普拉斯公式：
- $\Rightarrow$ ?? $F(w) =\int_{-\infty}^\infty f(t)e^{-st}dt$
由上式推導(dǎo)，很清楚的知道，當(dāng)s=jw時(shí)，拉普拉斯函數(shù)就變成了傅立葉函數(shù)，也就相當(dāng)于拉氏不再具有衰減功能。
又由上述公式可以很直觀地看到當(dāng)取值 $\sigma_0$ 剛好收斂時(shí)，則 $\sigma$ > $\sigma_0$ 的區(qū)域全都收斂。