在通常情況下,圖片是否清晰是個感性認識,同一個圖,有可能你覺得還過得去,而別人會覺得不清晰,缺乏一個統(tǒng)一的標準。然而有一些算法可以去量化圖片的清晰度,做到有章可循。
原理
如果之前了解過信號處理,就會知道最直接的方法是計算圖片的快速傅里葉變換,然后查看高低頻分布。如果圖片有少量的高頻成分,那么該圖片就可以被認為是模糊的。然而,區(qū)分高頻量多少的具體閾值卻是十分困難的,不恰當(dāng)?shù)拈撝祵?dǎo)致極差的結(jié)果。
我們期望的是一個單一的浮點數(shù)就可以表示圖片的清晰度。 Pech-Pacheco 在 2000 年模式識別國際會議提出將圖片中某一通道(一般用灰度值)通過拉普拉斯掩模做卷積運算,然后計算標準差,出來的值就可以代表圖片清晰度。
這種方法湊效的原因就在于拉普拉斯算子定義本身。它被用來測量圖片的二階導(dǎo)數(shù),突出圖片中強度快速變化的區(qū)域,和 Sobel 以及 Scharr 算子十分相似。并且,和以上算子一樣,拉普拉斯算子也經(jīng)常用于邊緣檢測。此外,此算法基于以下假設(shè):如果圖片具有較高方差,那么它就有較廣的頻響范圍,代表著正常,聚焦準確的圖片。但是如果圖片具有有較小方差,那么它就有較窄的頻響范圍,意味著圖片中的邊緣數(shù)量很少。正如我們所知道的,圖片越模糊,其邊緣就越少。
有了代表清晰度的值,剩下的工作就是設(shè)定相應(yīng)的閥值,如果某圖片方差低于預(yù)先定義的閾值,那么該圖片就可以被認為是模糊的,高于閾值,就不是模糊的。
實操
原理看起來比較復(fù)雜,涉及到很多信號啊圖片處理的相關(guān)知識,下面我們來實操一下,直觀感受下。
由于人生苦短,以及我個人是朋友圈第一 Python 吹子,我選擇使用 Python 來實現(xiàn),核心代碼簡單到令人發(fā)指:
import?cv2
def?getImageVar(imgPath):
????image?=?cv2.imread(imgPath);
????img2gray?=?cv2.cvtColor(image,?cv2.COLOR_BGR2GRAY)
????imageVar?=?cv2.Laplacian(img2gray,?cv2.CV_64F).var()
????return?imageVar
真是人生苦短啊,核心代碼就三行,簡單解釋下。
import cv2使用了一個著名的圖像處理庫 OpenCV,關(guān)于 OpenCV 的安裝這里不多贅述,需要注意的是它依賴 numpy。
image = cv2.imread(imgPath)使用 OpenCV 提供的方法讀取圖片。img2gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)轉(zhuǎn)化為灰度圖。如下圖:
原圖是這樣的:
cv2.Laplacian(img2gray, cv2.CV_64F)對圖片用 3x3 拉普拉斯算子做卷積,這里的cv2.CV_64F就是拉普拉斯算子。
在這里還是要推薦下我自己建的Python開發(fā)學(xué)習(xí)群:699749852,群里都是學(xué)Python開發(fā)的,如果你正在學(xué)習(xí)Python ,小編歡迎你加入,大家都是軟件開發(fā)黨,不定期分享干貨(只有Python軟件開發(fā)相關(guān)的),包括我自己整理的一份2018最新的Python進階資料和高級開發(fā)教程,歡迎進階中和進想深入Python的小伙伴? 。
原理部分說過,拉普拉斯算子經(jīng)常用于邊緣檢測,所以這里經(jīng)過拉普拉斯算子之后,留下的都是檢測到的邊緣。上圖經(jīng)過這步處理之后是這樣的:
可以看到這里圖片人物大致還是比較清晰的。
cv2.Laplacian(img2gray, cv2.CV_64F).var()計算出方差,并最后返回。
上面那張圖按這個計算出來時 3170 多,這個就是最后我們用來判斷清晰度的值。
可以再找一張看看:
原圖:
做灰度和經(jīng)過拉普拉斯算子之后,可以看到人物部分已經(jīng)不是很清晰了。
最后算出來的方差只有 530
剩下的工作就是根據(jù)整體圖片質(zhì)量確定閥值了。
局限性
通過上面的實操,我們知道這個算法的技巧在于設(shè)置合適的閥值,閾值太低會導(dǎo)致正常圖片被誤斷為模糊圖片,閾值太高會導(dǎo)致模糊圖片被誤判為正常圖片。閥值依賴于你實際應(yīng)用的業(yè)務(wù)場景,需要根據(jù)使用場景的不同做不同的定制。
真正的銀彈并不存在。除了需要定個閥值外,有些圖片可能會故意做個背景模糊或者背景虛化,這種圖片很容易被誤殺。
比如:
計算出來是這樣的,后面一大片都是黑的。
這個圖前景其實看著還行,但是背景有大片的虛化和模糊,這種情況下比較容易被誤殺。
所以最好還是在了解原理之后,根據(jù)實際場景來使用。
最后寫了個簡單的腳本,對傳入的圖片路徑的圖片進行計算,然后返回一個 json 字符串。
用法python getRank.py --imgs=./1.jpg,./2.jpg