圖像銳化與邊緣檢測
?
1.Roberts算子
Roberts算子又稱為交叉微分算法,它是基于交叉差分的梯度算法,通過局部差分計(jì)算檢測邊緣線條。常用來處理具有陡峭的低噪聲圖像,當(dāng)圖像邊緣接近于正45度或負(fù)45度時(shí),該算法處理效果更理想。其缺點(diǎn)是對邊緣的定位不太準(zhǔn)確,提取的邊緣線條較粗。
2.Prewitt算子
Prewitt是一種圖像邊緣檢測的微分算子,其原理是利用特定區(qū)域內(nèi)像素灰度值產(chǎn)生的差分實(shí)現(xiàn)邊緣檢測。由于Prewitt算子采用33模板對區(qū)域內(nèi)的像素值進(jìn)行計(jì)算,而Robert算子的模板為22,故Prewitt算子的邊緣檢測結(jié)果在水平方向和垂直方向均比Robert算子更加明顯。Prewitt算子適合用來識別噪聲較多、灰度漸變的圖像。
dst = filter2D(src, ddepth, kernel[, dst[, anchor[, delta[, borderType]]]])
- src表示輸入圖像
- dst表示輸出的邊緣圖,其大小和通道數(shù)與輸入圖像相同
- ddepth表示目標(biāo)圖像所需的深度
- kernel表示卷積核,一個(gè)單通道浮點(diǎn)型矩陣
- anchor表示內(nèi)核的基準(zhǔn)點(diǎn),其默認(rèn)值為(-1,-1),位于中心位置
- delta表示在儲(chǔ)存目標(biāo)圖像前可選的添加到像素的值,默認(rèn)值為0
- borderType表示邊框模式
import cv2
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(15, 8))
#讀取圖像
img = cv2.imread('data/test3.jpg')
lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#高斯濾波
gaussianBlur = cv2.GaussianBlur(grayImage, (3,3), 0)
#閾值處理
ret, binary = cv2.threshold(gaussianBlur, 127, 255, cv2.THRESH_BINARY)
#Roberts算子
kernelx = np.array([[-1, 0], [0, 1]], dtype=int)
kernely = np.array([[0, -1], [1, 0]], dtype=int)
x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx)
y = cv2.filter2D(grayImage, cv2.CV_16S, kernely)
#轉(zhuǎn)uint8
absX = cv2.convertScaleAbs(x)
absY = cv2.convertScaleAbs(y)
Roberts = cv2.addWeighted(absX, 0.5, absY, 0.5, 0)
#Prewitt算子
kernelx = np.array([[1, 1, 1], [0, 0, 0], [-1, -1, -1]], dtype=int)
kernely = np.array([[-1, 0, 1], [-1, 0, 1], [-1, 0, 1]], dtype=int)
x = cv2.filter2D(binary, cv2.CV_16S, kernelx)
y = cv2.filter2D(binary, cv2.CV_16S, kernely)
absX = cv2.convertScaleAbs(x)
absY = cv2.convertScaleAbs(y)
Prewitt = cv2.addWeighted(absX, 0.5, absY, 0.5, 0)
#用來正常顯示中文標(biāo)簽
plt.rcParams['font.sans-serif'] = ['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Roberts算子', u'Prewitt算子']
images = [lenna_img, Roberts, Prewitt]
for i in range(3):
plt.subplot(1, 3, i + 1), plt.imshow(images[i], 'gray')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()

3.Sobel算子
RSobel算子是一種用于邊緣檢測的離散微分算子,它結(jié)合了高斯平滑和微分求導(dǎo)。該算子用于計(jì)算圖像明暗程度近似值,根據(jù)圖像邊緣旁邊明暗程度把該區(qū)域內(nèi)超過某個(gè)數(shù)的特定點(diǎn)記為邊緣。Sobel算子在Prewitt算子的基礎(chǔ)上增加了權(quán)重的概念,認(rèn)為相鄰點(diǎn)的距離遠(yuǎn)近對當(dāng)前像素點(diǎn)的影響是不同的,距離越近的像素點(diǎn)對應(yīng)當(dāng)前像素的影響越大,從而實(shí)現(xiàn)圖像銳化并突出邊緣輪廓。Sobel算子的邊緣定位更準(zhǔn)確,常用于噪聲較多、灰度漸變的圖像。
Sobel算子根據(jù)像素點(diǎn)上下、左右鄰點(diǎn)灰度加權(quán)差,在邊緣處達(dá)到極值這一現(xiàn)象檢測邊緣。對噪聲具有平滑作用,提供較為精確的邊緣方向信息。因?yàn)镾obel算子結(jié)合了高斯平滑和微分求導(dǎo)(分化),因此結(jié)果會(huì)具有更多的抗噪性,當(dāng)對精度要求不是很高時(shí),Sobel算子是一種較為常用的邊緣檢測方法。
dst = Sobel(src, ddepth, dx, dy[, dst[, ksize[, scale[, delta[, borderType]]]]])
- src表示輸入圖像
- dst表示輸出的邊緣圖,其大小和通道數(shù)與輸入圖像相同
- ddepth表示目標(biāo)圖像所需的深度,針對不同的輸入圖像,輸出目標(biāo)圖像有不同的深度
- dx表示x方向上的差分階數(shù),取值1或 0
- dy表示y方向上的差分階數(shù),取值1或0
- ksize表示Sobel算子的大小,其值必須是正數(shù)和奇數(shù)
- scale表示縮放導(dǎo)數(shù)的比例常數(shù),默認(rèn)情況下沒有伸縮系數(shù)
- delta表示將結(jié)果存入目標(biāo)圖像之前,添加到結(jié)果中的可選增量值
- borderType表示邊框模式
在進(jìn)行Sobel算子處理之后,還需要調(diào)用convertScaleAbs()函數(shù)計(jì)算絕對值,并將圖像轉(zhuǎn)換為8位圖進(jìn)行顯示
dst = convertScaleAbs(src[, dst[, alpha[, beta]]])
- src表示原數(shù)組
- dst表示輸出數(shù)組,深度為8位
- alpha表示比例因子
- beta表示原數(shù)組元素按比例縮放后添加的值
import cv2
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(15, 8))
#讀取圖像
img = cv2.imread('data/test3.jpg')
lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#Sobel算子
x = cv2.Sobel(grayImage, cv2.CV_16S, 1, 0) #對x求一階導(dǎo)
y = cv2.Sobel(grayImage, cv2.CV_16S, 0, 1) #對y求一階導(dǎo)
absX = cv2.convertScaleAbs(x)
absY = cv2.convertScaleAbs(y)
Sobel = cv2.addWeighted(absX, 0.5, absY, 0.5, 0)
#用來正常顯示中文標(biāo)簽
plt.rcParams['font.sans-serif'] = ['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Sobel算子']
images = [lenna_img, Sobel]
for i in range(2):
plt.subplot(1, 2, i + 1), plt.imshow(images[i], 'gray')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()

4.Laplacian算子
拉普拉斯(Laplacian)算子是n維歐幾里德空間中的一個(gè)二階微分算子,常用于圖像增強(qiáng)領(lǐng)域和邊緣提取。它通過灰度差分計(jì)算鄰域內(nèi)的像素,基本流程是:判斷圖像中心像素灰度值與它周圍其他像素的灰度值,如果中心像素的灰度更高,則提升中心像素的灰度;反之降低中心像素的灰度,從而實(shí)現(xiàn)圖像銳化操作。在算法實(shí)現(xiàn)過程中,Laplacian算子通過對鄰域中心像素的四方向或八方向求梯度,再將梯度相加起來判斷中心像素灰度與鄰域內(nèi)其他像素灰度的關(guān)系,最后通過梯度運(yùn)算的結(jié)果對像素灰度進(jìn)行調(diào)整。
Laplacian算子分為四鄰域和八鄰域,四鄰域是對鄰域中心像素的四方向求梯度,八鄰域是對八方向求梯度。當(dāng)鄰域內(nèi)像素灰度相同時(shí),模板的卷積運(yùn)算結(jié)果為0;當(dāng)中心像素灰度高于鄰域內(nèi)其他像素的平均灰度時(shí),模板的卷積運(yùn)算結(jié)果為正數(shù);當(dāng)中心像素的灰度低于鄰域內(nèi)其他像素的平均灰度時(shí),模板的卷積為負(fù)數(shù)。對卷積運(yùn)算的結(jié)果用適當(dāng)?shù)乃ト跻蜃犹幚聿⒓釉谠行南袼厣?,就可以?shí)現(xiàn)圖像的銳化處理。
dst = Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]])
- src表示輸入圖像
- dst表示輸出的邊緣圖,其大小和通道數(shù)與輸入圖像相同
- ddepth表示目標(biāo)圖像所需的深度
- ksize表示用于計(jì)算二階導(dǎo)數(shù)的濾波器的孔徑大小,其值必須是正數(shù)和奇數(shù),且默認(rèn)值為1
- scale表示計(jì)算拉普拉斯算子值的可選比例因子。默認(rèn)值為1
- delta表示將結(jié)果存入目標(biāo)圖像之前,添加到結(jié)果中的可選增量值,默認(rèn)值為0
- borderType表示邊框模式
import cv2
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(15, 8))
#讀取圖像
img = cv2.imread('data/test3.jpg')
lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#拉普拉斯算法
dst = cv2.Laplacian(grayImage, cv2.CV_16S, ksize=3)
Laplacian = cv2.convertScaleAbs(dst)
#用來正常顯示中文標(biāo)簽
plt.rcParams['font.sans-serif'] = ['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Laplacian算子']
images = [lenna_img, Laplacian]
for i in range(2):
plt.subplot(1, 2, i + 1), plt.imshow(images[i], 'gray')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()

5.Scharr算子
由于Sobel算子在計(jì)算相對較小的核的時(shí)候,其近似計(jì)算導(dǎo)數(shù)的精度比較低,比如一個(gè)33的Sobel算子,當(dāng)梯度角度接近水平或垂直方向時(shí),其不精確性就越發(fā)明顯。Scharr算子同Sobel算子的速度一樣快,但是準(zhǔn)確率更高,尤其是計(jì)算較小核的情景,所以利用3*3濾波器實(shí)現(xiàn)圖像邊緣提取更推薦使用Scharr算子
Scharr算子又稱為Scharr濾波器,也是計(jì)算x或y方向上的圖像差分,在OpenCV中主要是配合Sobel算子的運(yùn)算而存在的。Scharr算子的函數(shù)原型如下所示,和Sobel算子幾乎一致,只是沒有ksize參數(shù).
dst = Scharr(src, ddepth, dx, dy[, dst[, scale[, delta[, borderType]]]]])
- src表示輸入圖像
- dst表示輸出的邊緣圖,其大小和通道數(shù)與輸入圖像相同
- ddepth表示目標(biāo)圖像所需的深度,針對不同的輸入圖像,輸出目標(biāo)圖像有不同的深度
- dx表示x方向上的差分階數(shù),取值1或 0
- dy表示y方向上的差分階數(shù),取值1或0
- scale表示縮放導(dǎo)數(shù)的比例常數(shù),默認(rèn)情況下沒有伸縮系數(shù)
- delta表示將結(jié)果存入目標(biāo)圖像之前,添加到結(jié)果中的可選增量值
- borderType表示邊框模式,更多詳細(xì)信息查閱BorderTypes
import cv2
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 4))
#讀取圖像
img = cv2.imread('data/test3.jpg')
lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Scharr算子
x = cv2.Scharr(grayImage, cv2.CV_32F, 1, 0) #X方向
y = cv2.Scharr(grayImage, cv2.CV_32F, 0, 1) #Y方向
absX = cv2.convertScaleAbs(x)
absY = cv2.convertScaleAbs(y)
Scharr = cv2.addWeighted(absX, 0.5, absY, 0.5, 0)
#用來正常顯示中文標(biāo)簽
plt.rcParams['font.sans-serif'] = ['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Scharr算子']
images = [lenna_img, Scharr]
for i in range(2):
plt.subplot(1, 2, i + 1), plt.imshow(images[i], 'gray')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()

6.Canny算子
Canny邊緣檢測算子(多級邊緣檢測算法)是一種被廣泛應(yīng)用于邊緣檢測的標(biāo)準(zhǔn)算法,其目標(biāo)是找到一個(gè)最優(yōu)的邊緣檢測解或找尋一幅圖像中灰度強(qiáng)度變化最強(qiáng)的位置。最優(yōu)邊緣檢測主要通過低錯(cuò)誤率、高定位性和最小響應(yīng)三個(gè)標(biāo)準(zhǔn)進(jìn)行評價(jià)。
Canny算子的實(shí)現(xiàn)步驟如下:
- 使用高斯平滑去除噪聲。
- 按照Sobel濾波器步驟計(jì)算梯度幅值和方向,尋找圖像的強(qiáng)度梯度。
- 通過非極大值抑制(Non-maximum Suppression)過濾掉非邊緣像素,將模糊的邊界變得清晰。
- 利用雙閾值方法來確定潛在的邊界。
- 利用滯后技術(shù)來跟蹤邊界。若某一像素位置和強(qiáng)邊界相連的弱邊界認(rèn)為是邊界,其他的弱邊界則被刪除。
edges = Canny(image, threshold1, threshold2[, edges[, apertureSize[, L2gradient]]])
- mage表示輸入圖像
- edges表示輸出的邊緣圖,其大小和類型與輸入圖像相同
- threshold1表示第一個(gè)滯后性閾值
- threshold2表示第二個(gè)滯后性閾值
- apertureSize表示應(yīng)用Sobel算子的孔徑大小,其默認(rèn)值為3
- L2gradient表示一個(gè)計(jì)算圖像梯度幅值的標(biāo)識,默認(rèn)值為false
import cv2
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 4))
#讀取圖像
img = cv2.imread('data/test3.jpg')
lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#高斯濾波降噪
gaussian = cv2.GaussianBlur(grayImage, (3, 3), 0)
#Canny算子
Canny = cv2.Canny(gaussian, 50, 150)
#用來正常顯示中文標(biāo)簽
plt.rcParams['font.sans-serif'] = ['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Canny算子']
images = [lenna_img, Canny]
for i in range(2):
plt.subplot(1, 2, i + 1), plt.imshow(images[i], 'gray')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()

7.LOG算子
LOG(Laplacian of Gaussian)邊緣檢測算子也稱為Marr&Hildreth算子,它根據(jù)圖像的信噪比來求檢測邊緣的最優(yōu)濾波器。該算法首先對圖像做高斯濾波,然后再求其拉普拉斯(Laplacian)二階導(dǎo)數(shù),根據(jù)二階導(dǎo)數(shù)的過零點(diǎn)來檢測圖像的邊界,即通過檢測濾波結(jié)果的零交叉(Zero crossings)來獲得圖像或物體的邊緣。
LOG算子該綜合考慮了對噪聲的抑制和對邊緣的檢測兩個(gè)方面,并且把Gauss平滑濾波器和Laplacian銳化濾波器結(jié)合了起來,先平滑掉噪聲,再進(jìn)行邊緣檢測,所以效果會(huì)更好。 該算子與視覺生理中的數(shù)學(xué)模型相似,因此在圖像處理領(lǐng)域中得到了廣泛的應(yīng)用。它具有抗干擾能力強(qiáng),邊界定位精度高,邊緣連續(xù)性好,能有效提取對比度弱的邊界等特點(diǎn)。
import cv2
import numpy as np
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 4))
#讀取圖像
img = cv2.imread('data/test3.jpg')
lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#先通過高斯濾波降噪
gaussian = cv2.GaussianBlur(grayImage, (3, 3), 0)
#再通過拉普拉斯算子做邊緣檢測
dst = cv2.Laplacian(gaussian, cv2.CV_16S, ksize=3)
LOG = cv2.convertScaleAbs(dst)
#用來正常顯示中文標(biāo)簽
plt.rcParams['font.sans-serif'] = ['SimHei']
#顯示圖形
titles = [u'原始圖像', u'LOG算子']
images = [lenna_img, LOG]
for i in range(2):
plt.subplot(1, 2, i + 1), plt.imshow(images[i], 'gray')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()
