壓縮與視頻編碼

無損壓縮的特征:

信息保留:所有的原始數(shù)據(jù)在壓縮后都會被保留,解壓縮后與壓縮前完全一致。
使用場景:無損壓縮通常用于文本文件、程序代碼、圖像(如 PNG 格式)、音頻等需要保持原始質(zhì)量的文件類型。
技術(shù)實現(xiàn):ZIP壓縮結(jié)合了霍夫曼編碼和LZ77等算法,確保在壓縮過程中不丟失任何數(shù)據(jù)。

有損壓縮:

數(shù)據(jù)丟失:編碼過程會舍棄一些原始數(shù)據(jù)(通常是人眼或人耳不易察覺的細節(jié)),以換取更高的壓縮率。
不可逆:壓縮后的數(shù)據(jù)在解碼時不能完全恢復(fù)到原始的未壓縮狀態(tài),尤其是在高壓縮率下,細節(jié)丟失會更為明顯。
壓縮效率高:相比無損壓縮,有損壓縮能夠顯著減小文件大小,適用于帶寬和存儲空間有限的場景,如在線視頻、圖片分享等。
感知質(zhì)量優(yōu)化:有損壓縮會根據(jù)人類視覺或聽覺系統(tǒng)的特性,優(yōu)先保留對人類感知更重要的信息(如低頻部分),舍棄不容易察覺的高頻細節(jié)和噪聲。

視頻編碼過程

1.顏色空間轉(zhuǎn)換(RGB → YUV/YCbCr)
2.分塊處理(通常為 8×8 或 16×16)
3.預(yù)測編碼(幀內(nèi)/幀間)
4.變換(DCT 頻域變換)
5.量化(壓縮高頻系數(shù))
6.熵編碼(進一步壓縮)
7.輸出碼流(用于存儲或傳輸)

1. 顏色空間轉(zhuǎn)換

將原始視頻/圖像的 RGB 顏色空間轉(zhuǎn)換為 YUV 或 YCbCr 顏色空間。這樣做是因為人眼對亮度(Y)信息更敏感,而對色度(U 和 V)信息不敏感。因此,色度信息可以被適當(dāng)壓縮而不明顯影響感知質(zhì)量。將 RGB 轉(zhuǎn)換為 YUV/YCbCr 顏色空間后,色度分量(U 和 V)的數(shù)據(jù)量可以被壓縮,但這個步驟的壓縮程度有限。

2. 分塊處理

將圖像分成小塊(如 8×8 或 16×16 像素的塊)。編碼器對每個塊分別進行處理。本身并不壓縮數(shù)據(jù),而是將圖像分為更小的塊,便于后續(xù)處理。

3. 預(yù)測編碼

根據(jù)相鄰塊或前后幀的圖像信息,預(yù)測當(dāng)前塊的內(nèi)容,通過幀內(nèi)預(yù)測和幀間預(yù)測減少冗余信息,能壓縮一部分?jǐn)?shù)據(jù)。分為兩種主要類型:
幀內(nèi)預(yù)測(Intra Prediction):在同一幀內(nèi),通過相鄰塊預(yù)測當(dāng)前塊。
幀間預(yù)測(Inter Prediction):通過參考前后幀的相似塊,預(yù)測當(dāng)前塊。

4. 變換(DCT)

將每個塊的像素值通過離散余弦變換(DCT)轉(zhuǎn)換到頻域,得到一組頻域系數(shù)。DCT 能集中圖像的能量到低頻部分,從而使高頻部分(細節(jié)和噪聲)可以進行壓縮。將圖像從空間域轉(zhuǎn)換到頻域,便于后續(xù)壓縮,但這個過程本身并不直接壓縮數(shù)據(jù),為量化做數(shù)據(jù)準(zhǔn)備

5. 量化

對變換后的頻域系數(shù)進行量化。通過舍棄或簡化高頻系數(shù),實現(xiàn)數(shù)據(jù)壓縮。量化過程中,低頻部分被精確保留,而高頻部分被大幅度壓縮或丟棄。通過舍棄或簡化高頻細節(jié)信息(尤其是人眼不易察覺的細節(jié))大幅減少了需要存儲和傳輸?shù)臄?shù)據(jù)量。它將變換后的頻域系數(shù)除以量化步長并四舍五入成整數(shù),導(dǎo)致高頻分量(通常是圖像中的細節(jié)和噪聲)被大量壓縮甚至完全舍棄。
量化過程中丟失的高頻信息無法恢復(fù),導(dǎo)致不可逆的有損壓縮。這也是壓縮率提高的主要來源。量化步驟也是壓縮數(shù)據(jù)量最多的環(huán)節(jié)

6. 熵編碼

量化后的數(shù)據(jù)進行熵編碼,如霍夫曼編碼或算術(shù)編碼。熵編碼進一步減少數(shù)據(jù)冗余,通過對數(shù)據(jù)的統(tǒng)計特性進行編碼,以更少的比特數(shù)表示高頻出現(xiàn)的數(shù)據(jù)。壓縮幅度相對較小。

DCT 的基本原理

DCT 的核心思想是將圖像數(shù)據(jù)從 空間域(像素的明暗值)轉(zhuǎn)換到 頻域(頻率成分)。在頻域中,大多數(shù)自然圖像的數(shù)據(jù)能量集中在低頻部分,而高頻部分則包含細節(jié)和噪聲。通過這種轉(zhuǎn)換,圖像可以通過量化低頻成分而保留主要信息,而高頻成分可以被去除或減少,達到壓縮的目的。

空間域與頻域

空間域:圖像的空間域就是我們看到的像素點陣,每個像素的值代表圖像中該位置的亮度(灰度圖)或顏色(彩色圖)。
頻域:在頻域中,圖像信息被表示為不同頻率的組合。低頻部分代表了圖像中的平滑變化(如大面積的背景顏色),高頻部分則包含了圖像中的細節(jié)和邊緣。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容