音視頻基礎(chǔ)

一、音視頻編碼

視頻編碼

視頻編碼分為兩個(gè)系列:
1.MPEG系列:
MPEG1(VCD使用)
MPEG2(DVD使用)
MPEG4(DVDRIP使用它的變種,如DivX,XviD等)
MPEG4 AVC
2.H.26X系列:
H261
H262
H263
H263+
H263++
H264

音頻編碼

音頻編碼格式有:
AAC:一種專(zhuān)為聲音數(shù)據(jù)設(shè)計(jì)的文件壓縮格式。
MP3:(Moving Picture Experts Group Audio Layer III)動(dòng)態(tài)影像專(zhuān)家壓縮標(biāo)準(zhǔn)音頻層面3,設(shè)計(jì)用來(lái)大幅度地降低音頻數(shù)據(jù)量。
AC3:Audio Coding Version 3,廣泛用于5.1聲道。

二、關(guān)鍵名詞

1、幀率

Frame Rate用于測(cè)量顯示幀數(shù)的量度,每秒顯示幀數(shù)(frames per second,簡(jiǎn)稱(chēng)fps)或者赫茲(Hz)。

2、分辨率

視頻分辨率是指視頻成像產(chǎn)品所形成的圖像的大小或者尺寸。

3、刷新率

刷新率是指屏幕每秒畫(huà)面被刷新的次數(shù),刷新率分為垂直刷新率和水平刷新率,一般提到的刷新率通常指垂直刷新率,以赫茲(Hz)為單位,通常80Hz的刷新率可以完全消除圖像的閃爍和抖動(dòng)感。

4、封裝格式

把編碼后的音視頻數(shù)據(jù)以一定格式封裝到一個(gè)容器,封裝格式有MKV、AVI、TS等。

5、碼率

碼率也就是比特率,比特率是單位時(shí)間播放連續(xù)的媒體的比特?cái)?shù)量。文件大?。╞yte)= 碼率(byte/s)*時(shí)長(zhǎng)(s)。

6、DTS與PTS

DTS:Decode Time Stamp,用于表示讀入內(nèi)存中的比特流在什么時(shí)候開(kāi)始送入解碼器中進(jìn)行解碼。
PTS:Presentation Time Stamp,用于度量解碼后的視頻幀什么時(shí)候被顯示出來(lái)。

7、YUV與RGB(后面會(huì)詳細(xì)聊到這個(gè))

YUV:是PAL與SECAM模擬彩色電視制式采用的顏色空間模型,其中Y代表亮度,UV代表色差,U和V是構(gòu)成顏色的兩個(gè)分量。
RGB:通過(guò)對(duì)R(red)、G(green)、B(blue)3個(gè)顏色通道的變化以及它們相互間的疊加來(lái)得到各式各樣的顏色。

8、視頻幀以及音頻幀

常見(jiàn)的視頻幀有I、P、B幀等。
I幀:關(guān)鍵幀,表示一幀畫(huà)面的完整保留。
P幀:差別幀,表示當(dāng)前幀與之前的一個(gè)關(guān)鍵幀或者P幀的差別,解碼的時(shí)候需要用之前換成的畫(huà)面疊加上本幀定義的差別生成最終畫(huà)面。
B幀:雙向差別幀,表示當(dāng)前幀記錄的是與前后幀的差別,解碼B幀不僅需要取得之前畫(huà)面的緩存,還要解碼之后的畫(huà)面,通過(guò)前后畫(huà)面的數(shù)據(jù)與本幀數(shù)據(jù)的疊加取得最終畫(huà)面。B幀的壓縮率高,但是解碼時(shí)對(duì)CPU的消耗也高。
音頻幀與編碼格式相關(guān),它是各個(gè)編碼標(biāo)準(zhǔn)自己實(shí)現(xiàn)的。
對(duì)PCM來(lái)說(shuō),它不需要幀的概率,根據(jù)采樣率和采樣精度就能播放。
AMR幀規(guī)定每20ms的音頻是一幀,每一幀的音頻都是獨(dú)立的,有可能采用不同的編碼算法以及不同的編碼參數(shù)。
MP3幀比較復(fù),包含更多的信息,比如采樣率、比特率等各種參數(shù)。具體如下:音頻數(shù)據(jù)幀個(gè)數(shù)由文件大小和幀長(zhǎng)決定,每一幀的長(zhǎng)度可能不固定,也可能固定,由比特率決定,每一幀又分為幀頭和數(shù)據(jù)實(shí)體兩個(gè)部分,幀頭記錄了MP3的比特率、采樣率、版本等信息,每一幀之間相互獨(dú)立。

9、量化精度

量化精度表示可以將模擬信號(hào)分成多少個(gè)等級(jí),量化精度越高,音樂(lè)的聲壓振幅越進(jìn)階原音樂(lè)。量化精度的單位是bit(比特),CD標(biāo)準(zhǔn) 的量化精度是16bit,DVD標(biāo)準(zhǔn)的量化精度是24bit。

10、采樣率

采樣率指每秒采樣點(diǎn)個(gè)數(shù),采樣率單位用赫茲(Hz)表示。

11、聲道

聲道(Sound Channel)是指聲音再錄制或者播放時(shí)在不同空間位置采集或回放的相互獨(dú)立的音頻信號(hào),所以聲道數(shù)也就是聲音錄制時(shí)的音源數(shù)量或回放時(shí)相應(yīng)的揚(yáng)聲器數(shù)量。
常見(jiàn)的聲道有單聲道、立體聲道、4聲道、5.1聲道、7。1聲道。
單聲道:設(shè)置一個(gè)揚(yáng)聲器。
立體聲道:把單聲道的揚(yáng)聲器擴(kuò)展為左右對(duì)稱(chēng)的兩個(gè)揚(yáng)聲器。
4聲道:4聲道環(huán)繞規(guī)定了4個(gè)發(fā)音點(diǎn),分別是前左、前右、后左、后右,聽(tīng)眾則被包圍在中間。
5.1聲道:將環(huán)繞聲道一分為二,中央位置增加重低音效果。
7.1聲道:在5.1的基礎(chǔ)上增加了中左和中右兩個(gè)發(fā)音點(diǎn)。

參考文獻(xiàn)

Android 音視頻開(kāi)發(fā)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容