2 用python進行OpenCV實戰(zhàn)之圖像基本知識

前言

在這一節(jié),我們將學習圖像的基本構成單元——像素,我們將詳細的探討什么是像素?像素是如何使用來構成圖像的?然后學習如何通過OpenCV來獲取和操縱像素。

1 什么是像素

所有的圖像都包含一組像素,像素是圖像的原始構建塊。 沒有比像素更細的單位了。
通常,我們將像素認為是在我們的圖像給定位置出現的光的顏色或者強度,如果我們將圖像考慮成一個網格,在網格中的每個方塊都包含一個單一的像素。例如,我們假設有一個分辨率是500300的圖像,這就意味著我們的圖像被分成一個關于像素的網格,這個網格有500個行,300個列,綜上可知,總共有500300=150000個像素在這張圖片中。
像素主要有兩種表達形式:灰度模式和彩色模式。在一張灰度圖片中,每個像素有一個從0至255{[0,255]}的值,其中0表示“純黑色”,255表示“純白色”,在0和255之間的值變現成不同深淺的灰色,當值靠近0時,圖像更暗,當值靠近255時,圖像更亮。
彩色模式的圖片通常用RGB顏色空間來表示(R for red, G for green, B for blue),還有一些其他的模式比如CMY,但是在這里我們先不討論。
我們以(red, green, blue)的形式來表示RGB元組,這個元組就表示了我們的顏色,其中這三種顏色的值用在[0,255]之間的整數值表示,所以我們通常用unsigned int類型來表示每個顏色的強度。
為了構成白色,我們需要用(255, 255, 255)來表示,為了得到黑色,我們需要用(0, 0, 0)來表示,紅(255, 0, 0),綠(0, 255, 0),藍(0, 0, 255).
RGB配色表

色光三原色

2 圖像坐標系概述

正如我們之前所提到的,我們將一張圖片以像素網格的形式表示,我們想象一下假設我們的圖片為一張圖表紙,圖像的左上角為原點。


圖像坐標系

3 獲取和操縱像素

上一節(jié)中,我們從磁盤中讀取了圖片,然后將它轉換了格式再存儲到了磁盤中,在這一節(jié)我們將對如何獲取和操縱圖像的像素進行實戰(zhàn),建立

getting_and_setting.py

3.1 代碼

from __future__ import print_function #1
import argparse #2
import cv2 #3

ap = argparse.ArgumentParser() #4
ap.add_argument("-i", "--image", required=True,
                help="Path to the image") #5
args = vars(ap.parse_args()) #6

image = cv2.imread(args["image"]) #7
cv2.imshow("Original", image) #8
 
(b, g, r) = image[0, 0] #9
print("Pixel at (0, 0) - Red: {}, Green: {}, Blue: {}".format(r, g, b)) #10

image[0, 0] = (0, 0, 255) #11
(b, g, r) = image[0, 0] #12
print("Pixel at (0, 0) - Red: {}, Green: {}, Blue: {}".format(r, g, b)) #13

corner = image[0:200, 0:100] #14
cv2.imshow("corner1", corner) #15

image[0:200, 0:100] = (0, 255, 0) #16
cv2.imshow("update", image) #17
cv2.waitKey(0) #18

3.2 代碼詳細解釋

#1-6:
關于這段代碼在第一節(jié)中已經進行過詳細解釋了,主要是為了導包,命令行參數的處理

#7-8:
展示原始圖片

#9:
在第一節(jié)中,就曾經提到過OpenCV是用NumPy數組來表示圖像的,我們也可以將這種表示看成是一種矩陣表示,為了獲取像素,我們需要應用我們所感興趣的x,y坐標,從中我們可以得到一個表示(r,g,b)的元組,然而,我們需要注意的是:在OpenCV中是以逆序存儲RGB通道到的,即我們通常以red,green,blue的順序來記憶,但是OpenCV則是以blue,green,red的順序來儲存的.

(b, g, r) = image[0, 0]

通過獲得圖像(0,0)處的像素,并將它賦值給一個三元組,我們可以再次看出OpenCV以逆序存取RGB像素,所以當我們在元組中得到每個元素時候,我們需要以BGR的順序來獲取

#10:
輸出RGB每個通道的值到終端??梢钥闯鑫覀儷@取像素值的方法非常簡單,而這一切都要歸功于NumPy,它替我們做了一系列的復雜工作。

#11:
我們操縱在左上角的像素,即在(0,0)處的像素,我們給他賦值(0,0,255),如果我們將它以RGB的格式來讀的話,我們認為:red值是0,green值是0,blue值是255,所以我們將得到純藍色。然而,正如我們之前所提到的OpenCV是以BGR的格式存儲像素的而不是RGB格式,所以我們實際上得到的是:red值是255,green值是0,blue值是0,因此我們得到的是一個純紅色而不是純藍色。

#12,13:
通過得到在(0,0)像素點的BGR顏色值,然后將它們以RGB的形式輸出

#14
獲取以及操縱單一的像素點是相當簡單的,那如果使用NumPy的數組分割能力得到圖像的一塊長方形區(qū)域呢?

corner = image[0:200, 0:100] #14

在第一節(jié)我們介紹過image的數組里的第一個參數是高即y,第二個參數是寬即x,所以corner將得到一個100*200大小的長方形區(qū)域,而這個區(qū)域即為圖像的左上角區(qū)域。

#15:
將corner以“Corner”的名稱顯示出來

#16:
將左上角的區(qū)域用(0,255,0)即綠色來表示,實現了改變一整塊區(qū)域的像素值的目的。

#17:
以“Updated”的名稱顯示圖像

#18:
cv2.waitKey()表示暫停腳本的執(zhí)行直到在鍵盤輸入一個按鍵,用“0”作為參數表示可以使用任何按鍵作為繼續(xù)腳本執(zhí)行的按鈕。

效果展示

顯示效果

轉載請注明出處:
CSDN:樓上小宇__home:http://http://blog.csdn.net/sty945
簡書:樓上小宇:http://www.itdecent.cn/u/1621b29625df

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容