音視頻技術(shù)(二)音頻編碼

二、音頻編碼


1.壓縮編碼

? ? ? ? 之前的文章中,我們提到過(guò)計(jì)算CD音質(zhì)的數(shù)據(jù)采樣,每分鐘需要存儲(chǔ)空間約為10.1MB。從存儲(chǔ)的角度或者網(wǎng)絡(luò)實(shí)時(shí)傳播的角度,這個(gè)數(shù)據(jù)量都是太大了,對(duì)于存儲(chǔ)和傳輸都是非常具有挑戰(zhàn)的,所以我們需要通過(guò)壓縮編碼

2.壓縮編碼的可能性

? ? ? ? 壓縮編碼的基本指標(biāo)就是壓縮比,壓縮比通常小于1(如果等于或者大于1,是不是就失去的壓縮的意義了,壓縮目的就是為了減少數(shù)據(jù)體量).壓縮算法分為2種,有損壓縮和無(wú)損壓縮.

無(wú)損壓縮:解壓后的數(shù)據(jù)可以完全復(fù)原.在常用的壓縮格式中,用的較多的都是有損壓縮.

有損壓縮:解壓后的數(shù)據(jù)不能完全復(fù)原,會(huì)丟失一部分信息.壓縮比越小,丟失的信息就會(huì)越多,信號(hào)還原的失真就會(huì)越大.

壓縮編碼的原理實(shí)際上就是壓縮冗余的信號(hào).冗余信號(hào)就是指不能被人耳感知的信號(hào).包括人耳聽覺范圍之外的音頻信號(hào)以及被掩蓋掉的音頻信號(hào).


人耳掩蓋效應(yīng):

? ? ? ? 主要表現(xiàn)在頻域掩蓋效應(yīng)與時(shí)域掩蓋效應(yīng).無(wú)論是在時(shí)域還是頻域上,被掩蓋掉的信息都認(rèn)為是冗余信息,不進(jìn)行編碼處理

? ? ? ? 掩蔽效應(yīng)指人的耳朵只對(duì)最明顯的聲音反應(yīng)敏感,而對(duì)于不明顯的聲音,反應(yīng)則較不為敏感。例如在聲音的整個(gè)頻率譜中,如果某一個(gè)頻率段的聲音比較強(qiáng),則人就對(duì)其它頻率段的聲音不敏感了。應(yīng)用此原理,人們發(fā)明了mp3等壓縮的數(shù)字音樂(lè)格式,在這些格式的文件里,只突出記錄了人耳朵較為敏感的中頻段聲音,而對(duì)于較高和較低的頻率的聲音則簡(jiǎn)略記錄,從而大大壓縮了所需的存儲(chǔ)空間。在人們欣賞音樂(lè)時(shí),如果設(shè)備對(duì)高頻響應(yīng)得比較好,則會(huì)使人感到低頻響應(yīng)不好,反之亦然。


3、無(wú)損編碼、無(wú)損壓縮編碼和有損壓縮編碼有什么區(qū)別?

1.無(wú)損編碼

? ? ? ? 從本質(zhì)上講是無(wú)壓縮的音頻,可以獲得更好的音頻質(zhì)量,并覆蓋人耳可以聽到的全部頻率。

? ? ? ? 未壓縮音頻文件最大的缺點(diǎn)是它的大小,一般一首歌曲通常在25-40 MB之間。一些便攜式音樂(lè)播放器或設(shè)備可能不支持未壓縮的音頻格式。

優(yōu)點(diǎn):沒(méi)有壓縮,無(wú)損,完整的音頻,對(duì)計(jì)算機(jī)性能上的占用小,更容易在后期工作中使用

缺點(diǎn):文件很大,有些便攜式設(shè)備可能不支持它


無(wú)損壓縮編碼

? ? ? ? “無(wú)損壓縮”這個(gè)名字可能聽起來(lái)像是一個(gè)矛盾的事情。我更喜歡將其解釋為“節(jié)省空間的無(wú)損”。它先將音樂(lè)文件壓縮,然后在播放過(guò)程中解壓縮。這樣可以縮小文件大小,但音頻質(zhì)量仍然無(wú)損,可實(shí)現(xiàn)全頻率播放。

? ? ? ? 無(wú)損壓縮音頻文件,可以是無(wú)損音頻文件的1/2到1/3,甚至更小。無(wú)損壓縮文件的缺點(diǎn),是它更占計(jì)算機(jī)性能(與未壓縮和壓縮的有損相比。)它們還需要更多的計(jì)算機(jī)運(yùn)算來(lái)進(jìn)行解碼。

優(yōu)點(diǎn):文件較小,無(wú)損

缺點(diǎn):更占計(jì)算機(jī)性能


有損壓縮

? ? ? ? 壓縮有損音頻格式,可能是你在聽音樂(lè)時(shí)使用的最常見的音頻文件。(例如.MP3和.AAC。)這是因?yàn)閴嚎s的有損音頻文件在便攜式設(shè)備中具有最大的支持,并且它們具有最小的文件大?。ㄒ馕吨憧梢栽诟〉目臻g中,存儲(chǔ)更多的歌曲。)

? ? ? 但是,所有壓縮都需要付出代價(jià),與無(wú)損格式相比,有限的頻率范圍和明顯的音頻偽像,使音質(zhì)大打折扣。有損壓縮的音頻文件,也不適合音樂(lè)循環(huán),因?yàn)榫幗獯a器在文件的開頭和結(jié)尾添加了短空格,循環(huán)會(huì)產(chǎn)生卡頓。

優(yōu)點(diǎn):最小的文件大小,廣泛的播放支持

缺點(diǎn):有損,音質(zhì)差,不適合后期處理和編輯


當(dāng)涉及到剪輯使用音頻格式時(shí),盡可能使用.WAV或.AIFF等未壓縮格式是最好的選擇。


4.常見的音頻格式

無(wú)損的文件格式: .WAV,.AIFF

無(wú)損壓縮文件格式: .FLAC,ALAC(Apple Lossless)

有損壓縮文件式: .MP3,.AAC,.WMA,.OGG

WAV編碼格式

WAV編碼的一種實(shí)現(xiàn)方式(其實(shí)它有非常多實(shí)現(xiàn)方式,但都是不會(huì)進(jìn)行壓縮操作).就是在源PCM數(shù)據(jù)格式的前面加上44個(gè)字節(jié).分別用來(lái)描述PCM的采樣率,聲道數(shù),數(shù)據(jù)格式等信息.

特點(diǎn):音質(zhì)非常好。

適合場(chǎng)合:多媒體開發(fā)的中間文件,保存音樂(lè)和音效素材

MP3編碼格式

MP3編碼具有不錯(cuò)的壓縮比,而且聽感也接近于WAV文件,當(dāng)然在不同的環(huán)境下,應(yīng)該調(diào)整合適的參數(shù)來(lái)達(dá)到更好的效果.

特點(diǎn):音質(zhì)在128Kbit/s以上表現(xiàn)不錯(cuò),壓縮比比較高.大量軟件和硬件都支持.兼容性高.

適合場(chǎng)合:高比特率下對(duì)兼容性有要求的音樂(lè)欣賞.

AAC編碼格式

AAC是目前比較熱門的有損壓縮編碼技術(shù),并且衍生了LC-AAC,HE-AAC,HE-AAC v2 三種主要編碼格式.

LC-AAC 是比較傳統(tǒng)的AAC,主要應(yīng)用于中高碼率的場(chǎng)景編碼(>= 80Kbit/s)

HE-AAC 主要應(yīng)用于低碼率場(chǎng)景的編碼(<= 48Kbit/s)

特點(diǎn):在小于128Kbit/s的碼率下表現(xiàn)優(yōu)異,廣泛應(yīng)用于互聯(lián)網(wǎng)視頻中

適合場(chǎng)景:于128Kbit/s以下的音頻編碼,多用于互聯(lián)網(wǎng)視頻中的音頻軌的編碼

Ogg編碼格式

Ogg編碼是一種非常有潛力的編碼,在各種碼率下都有比較優(yōu)秀的表現(xiàn).尤其在低碼率場(chǎng)景下.Ogg除了音質(zhì)好之外,Ogg的編碼算法也是非常出色.可以用更小的碼率達(dá)到更好的音質(zhì).128Kbit/s的Ogg比192Kbit/s甚至更高碼率的MP3更優(yōu)質(zhì).但目前由軟件還是硬件支持問(wèn)題,都沒(méi)法達(dá)到與MP3的使用廣度.

特點(diǎn):可以用比MP3更小的碼率實(shí)現(xiàn)比MP3更好的音質(zhì),高中低碼率下均有良好的表現(xiàn),兼容不夠好,流媒體特性不支持.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 要在計(jì)算機(jī)內(nèi)播放或是處理音頻文件,也就是要對(duì)聲音文件進(jìn)行數(shù)、模轉(zhuǎn)換,這個(gè)過(guò)程同樣由采樣和量化構(gòu)成,人耳所能聽到的聲...
    Viking_Den閱讀 10,573評(píng)論 1 10
  • 概述 本片文章主要介紹音頻基礎(chǔ),在做音頻開發(fā)之前首先必須要對(duì)音頻的相關(guān)概念了解。以下是具體內(nèi)容概述: 常見的音頻格...
    iosmedia閱讀 2,972評(píng)論 0 1
  • 前言 上一篇的時(shí)候,已經(jīng)簡(jiǎn)單介紹過(guò)一些音頻的基礎(chǔ)知識(shí)。我們說(shuō)到,通常采用脈沖代碼調(diào)制編碼,即PCM(Pulse C...
    請(qǐng)叫我果爸閱讀 5,794評(píng)論 0 5
  • 最近在做一個(gè)直播項(xiàng)目,項(xiàng)目按鈕點(diǎn)擊有音效,進(jìn)入某個(gè)頁(yè)面還需要有背景音樂(lè)。這里主要用到SoundPool、Servi...
    黃海佳閱讀 6,649評(píng)論 0 3
  • 前言 本篇開始講解在Android平臺(tái)上進(jìn)行的音頻編輯開發(fā),首先需要對(duì)音頻相關(guān)概念有基礎(chǔ)的認(rèn)識(shí)。所以本篇要講解以下...
    Ihesong閱讀 8,053評(píng)論 2 18

友情鏈接更多精彩內(nèi)容