數(shù)字圖像處理-Digital Image Processing(DIP)天津大學(xué)版

第一章 數(shù)字圖像處理概述 天津大學(xué)版


第一講:數(shù)字圖像處理的基本概率

整個課程用 Visual C++ 和 MATLAB 結(jié)合做圖像處理

色度學(xué)理論認(rèn)為,任何顏色可由 紅、綠、藍(lán) 三種顏色混合得到。

1 Byte(字節(jié)) = 8 bit(比特)
1 KB = 1024 Byte
1 MB = 1024 KB 

圖形
由指令集合組成,指令由位置、形狀、顏色等描述。記錄的是坐標(biāo)值,顏色隱含,統(tǒng)一描述。顯示時執(zhí)行命令,轉(zhuǎn)變?yōu)槠聊簧纤吹降男螤詈皖伾?/p>

圖像
圖像是矩陣,它里面的數(shù)據(jù)就是每一點(diǎn)的顏色值,位置按規(guī)則排列。

圖像的表示

上圖是一個9像素的圖像,左上角最黑的是0,左下角很白的是250.

第二講:圖像的存儲格式

圖像有2位的黑白圖像,8位灰度圖像,8位彩色圖像,其中8位灰白、彩色圖像都帶 8位索引圖像,一個數(shù)據(jù)矩陣x和一個調(diào)色板矩陣MAP。只有一個像素占8位的時候,才有索引矩陣,才有個顏色表。8位灰度的索引表和索引號是對應(yīng)的,RGB相等。

對于一個256色(BPP=8)的800*600分辨率的圖像而言,若R、G、B分別采用一個字節(jié)描述,則需要 800*600*3=1440000Byte的存儲空間,使用顏色表則只需800*600*1+256*3=480768Byte的存儲空間,顏色表是提前設(shè)置好的表,通過索引即可推斷出 R、G、B的值。矩陣中每個元素的值就是 顏色表中的索引號。

真彩圖像:一個像素就24位 ,能表現(xiàn)的顏色數(shù)量為2^24,能表達(dá)接近實(shí)際世界的顏色。
真彩圖像不帶索引號,它每個像素直接是RGB值 (還有更高的48位彩色,目前只用在少數(shù)特殊行業(yè),我們一般的顯示屏也都是24位彩色,2^24=1677萬色人眼已經(jīng)無法分辨,夠用了)
常見的圖片格式:

JPEG (Joint Photographic Experts Group) 其優(yōu)點(diǎn)為兼容性高、傳輸速度快、內(nèi)存小。大部分的數(shù)碼相機(jī)都能夠拍 JPEG,它是一種有損壓縮方案,可在保持較高圖片質(zhì)量的前提下,被壓縮到原圖內(nèi)存的二十分之一大小,令細(xì)節(jié)和質(zhì)量流失。但同時文件比較小,一些相機(jī)能夠拍不同畫質(zhì)的 JPEG﹙如低、中、高三種﹚。意味著畫質(zhì)越高,壓縮得越少,文件也會相對地大。當(dāng)然,如果是出于對圖片高質(zhì)量的要求,JPG格式的圖片依然存在失真的情況,故而無法與PNG或TIF格式相比較。還有一個注意點(diǎn),就是在圖片編輯中,對于JPG格式的圖片,每一次輸出都會損失像素質(zhì)量,在用圖片編輯軟件,編輯JPG格式的圖片時,盡量不要過于頻繁地保存步驟,防止像素?fù)p失。

TIFF (Tagged Image File Format)RAWDNG (Digital Negative)  是一種靈活的位圖格式,這是最常用的工業(yè)標(biāo)準(zhǔn)格式,有一些印刷商會要求 TIFF 檔。使用無損格式存儲圖像的能力使TIFF文件成為圖像存檔的有效方法。與JPEG不同,TIFF文件可以編輯然后重新存儲而不會有壓縮損失。在后期上比較容易,但在記憶卡上占用更多容間。優(yōu)點(diǎn):能在后期軟件上作后期制作、用于打印。缺點(diǎn):檔案較大,也占用空間。主要用來存儲包括照片和藝術(shù)圖在內(nèi)的圖像。 

PNG (Portable Network Graphics)  “可移植網(wǎng)絡(luò)圖形格式“,是圖像文件存儲格式,其設(shè)計(jì)目的是試圖替代GIF和TIFF文件格式,同時增加一些GIF文件格式所不具備的特性。對于圖片本身質(zhì)量的減損非常低。因其能夠支持壓縮不失真、透明背景、漸變圖像的制作要求,PNG格式也是各大制圖軟件例如PS、InDesign輸出或編輯的原始格式。PNG文件非常適合在互聯(lián)網(wǎng)上使用。但它也不足以用作專業(yè)印刷。優(yōu)點(diǎn):能夠相容半透明 / 透明圖像,缺點(diǎn):檔案比 JPEG 大,不能用于印刷PNG 

GIF (Graphics Interchange Format) GIF格式的圖片是分為靜態(tài)和動態(tài)兩種的。靜態(tài)的GIF格式圖片和JPG格式的圖片無異,而動態(tài)的GIF圖片則是由多幅圖片保存為一個圖片,形成動畫效果而制成的。然而,它們只能包含最多 256 種顏色,因此并不適合用在照片上,除非照片的顏色比較單一。優(yōu)點(diǎn):檔案小、非常適合在網(wǎng)頁使用,可以制作動畫缺點(diǎn):包容顏色太少

BMP (Bitmap)PSD (Photoshop Document) BMP 是由微軟發(fā)明,最初在 Windows 平臺上使用,但現(xiàn)在 Mac 電腦上也能用到 BMP格式。BMP 格式能把顏色數(shù)據(jù)保存在每一個單獨(dú)的像素中,BMP格式的圖片文件內(nèi)存較大,不會作任何壓縮,保存了每個像素的信息。優(yōu)點(diǎn):可用于打印,是能保留高品質(zhì)影像的格式,缺點(diǎn):檔案一般較大。

第三講 BMP文件存儲格式

BMP文件由四部分組成

  • BMP文件頭:BITMAP FILE HEADER
    里面存放第一個東西是 2個字節(jié),是bm文件標(biāo)識符,后面4個字節(jié)存放 文件的大小 bisize,后面2個字節(jié)是0,再后面還是2個0,再后面4個字節(jié)是數(shù)據(jù)區(qū)的起始位置,總共字節(jié) 2+4+2+2+4=14字節(jié)

  • 位圖信息頭: BITMAP INFOHEADER
    這里定義了很多信息,著重說幾點(diǎn),首先定義了本結(jié)構(gòu)bisize的大小,總共 40字節(jié)。

  • 顏色表: RGB QUAD
    顏色表有3種顏色,實(shí)際上有個保留字,實(shí)際是4個字節(jié),最后一個保留。

  • 位圖像素 數(shù)據(jù)

第四講 基于MATLAB的圖像處理基礎(chǔ)

將一幅真彩圖像變成灰度圖像,MATLAB代碼如下:

close all;   # 關(guān)閉當(dāng)前所有圖形窗口
clear all; # 清空工作空間變量
clc:;  # 清屏 (以上三步是新建程序的基本步驟)
X = imread('football.jpg'); # X讀取文件格式為.jpg。文件名為 football的JPG圖像
I = rgb2gray(X); 將RGB圖像轉(zhuǎn)化為灰度圖像
set(0, 'defaultFigurePositon', [100, 100, 1000, 500]); # 修改圖形圖像的位置默認(rèn)設(shè)置
set(0, 'defaultFigureColor', [1 0 1]); # 修改圖形背景顏色的設(shè)置
subplot(121), imshow(X);  #顯示原RGB圖像
subplot(122), imshow(I);  #顯示轉(zhuǎn)換后的灰度圖像


第二章 圖像處理編程

第一講 圖像處理編程基礎(chǔ)

教學(xué)軟件 VC_DIP框架結(jié)構(gòu)




數(shù)字圖像處理 剛薩雷斯版

1.2 數(shù)字圖像的起源

數(shù)字圖像處理最早的應(yīng)用是報(bào)紙業(yè),把圖像從紐約通過還跌光纜傳輸?shù)絺惗亍?929年時候,可以做到15個灰度圖像的傳輸。
1964年美國通過數(shù)字圖像技術(shù)獲取第一張?jiān)虑虮砻鎴D片。

2.0 數(shù)字圖像基礎(chǔ)

人眼的錯覺
人類可見光范圍

2.3.4 簡單的圖像形成模型

可以用函數(shù) f(x,y) 表示一個圖像。0< f(x,y) < 無限大~
函數(shù)f(x,y) 可以由2個分量來表征,入射到觀察場的光源總量;場景中物體反射光的總量,分別表示為i(x,y),r(x,y)
f(x,y) = i(x,y)r(x,y) 0<i(x,y)<無窮 0< r(x,y)<1

2.4 數(shù)字圖像的表示

對于一幅大小是 M*N ,灰度級為L = 2 ^k 的數(shù)字圖像,其存儲空間為 b = M * N * k
當(dāng)一個圖像有2^k 個灰度時候,一般稱這個圖像為 k比特圖像。

2.4.2 放大或縮小數(shù)字圖像

放大和縮小數(shù)字圖像需要執(zhí)行的兩個步驟:

  1. 計(jì)算新的像素在原圖中的位置
  2. 為這些對應(yīng)的位置賦新灰度值

一維線性差值:已知2個點(diǎn),這2個點(diǎn)中間的點(diǎn)的坐標(biāo)。
臨近差值,雙線性差值,雙線性差值效果好,不容易造成圖像細(xì)節(jié)丟失,臨近差值簡單,速度快。


注意區(qū)分鄰域和鄰接概念的不同
m鄰接

m混合鄰接是對 8鄰接的改進(jìn),為了消除8鄰接容易發(fā)生的 二義性

2.6 數(shù)字圖像處理中所用數(shù)學(xué)工具的介紹

陣列與矩陣操作
線性操作與非線性操作
集合和邏輯操作
使用圖像相乘和相除來降低陰影

第三章. 灰度變換與空間濾波

術(shù)語空間域 指的是圖像平面本身,這類圖像處理方法直接以圖像中的像素操作為基礎(chǔ)。而變換域的圖像處理首先把一幅圖像變換到變換域,在變換域中進(jìn)行處理,然后通過反變換把處理結(jié)果返回到空間域。空間域處理主要分為 灰度變換和空間濾波兩類。 灰度變換在圖像的單個像素上操作,主要以對比度和閾值處理為目的??臻g濾波涉及改善性能和操作,如通過圖像中的每一個像素的鄰域處理來銳化圖像。

3.1.1 灰度變換和空間濾波基礎(chǔ)

我們知道空間域就是簡單的包含圖像像素的平面,空間域的技術(shù)直接在圖像像素上進(jìn)行操作。比如一些圖像增強(qiáng)。
對于頻域來說,其操作是在圖像上進(jìn)行傅里葉變換的基礎(chǔ)上進(jìn)行。

3.2 一些基本的灰度變換函數(shù)

圖像反轉(zhuǎn)
對數(shù)變換
冪律(伽馬)變換
分段線性變換函數(shù)

3.3. 直方圖處理

直方圖是多種空間域處理技術(shù)的基礎(chǔ)。直方圖操作可以用于圖像增強(qiáng)、圖像壓縮、分割。
直方圖均衡:增強(qiáng)對比度,使得圖片能顯示更多細(xì)節(jié),適合偏亮的圖片
直方圖匹配(規(guī)定化):使灰度提高,圖片更亮,適合偏暗的圖片

3.4 空間濾波基礎(chǔ)

低通濾波器的最終效果是模糊(平滑)一幅圖像。

3.5 平滑空間濾波器

平滑濾波器用于模糊處理和降低噪聲。模糊處理經(jīng)常用于預(yù)處理任務(wù)中,例如在目標(biāo)中提取之前去除圖像中的一些瑣碎細(xì)節(jié),以及橋接直線或者曲線的縫隙。通過線性濾波器和非線性濾波模糊處理,可以降低噪聲。

3.6 銳化空間濾波器

銳化處理的主要目的是突出灰度的過渡部分。

使用二階微分進(jìn)行圖像銳化---拉普拉斯算子

第四章 頻率域?yàn)V波

濾波器:抑制或最小化某些頻率的波或振蕩的裝置或材料
頻率:自變量單位變化期間,一個周期函數(shù)重復(fù)相同值序列的次數(shù)

4.1 傅里葉級數(shù)和 變換簡史

傅里葉在這個領(lǐng)域的貢獻(xiàn)是,他指出任何周期函數(shù)都可以表示為不同頻率的正玄或者余弦之和的形式,每個正弦項(xiàng)和/或余弦項(xiàng) 乘以不同的系數(shù)(現(xiàn)在稱該和未傅里葉級數(shù)),甚至非周期函數(shù)(但該曲線下的面積是有限的)也可以用正弦和/余弦 乘以 加權(quán)函數(shù)的積分來表示。用傅里葉級數(shù)或者變換表示的函數(shù)特征完全可以通過傅里葉反變換來重建,而不會丟失任何信息。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。

友情鏈接更多精彩內(nèi)容