二、音頻編碼
1.壓縮編碼
? ? ? ? 之前的文章中,我們提到過(guò)計(jì)算CD音質(zhì)的數(shù)據(jù)采樣,每分鐘需要存儲(chǔ)空間約為10.1MB。從存儲(chǔ)的角度或者網(wǎng)絡(luò)實(shí)時(shí)傳播的角度,這個(gè)數(shù)據(jù)量都是太大了,對(duì)于存儲(chǔ)和傳輸都是非常具有挑戰(zhàn)的,所以我們需要通過(guò)壓縮編碼
2.壓縮編碼的可能性
? ? ? ? 壓縮編碼的基本指標(biāo)就是壓縮比,壓縮比通常小于1(如果等于或者大于1,是不是就失去的壓縮的意義了,壓縮目的就是為了減少數(shù)據(jù)體量).壓縮算法分為2種,有損壓縮和無(wú)損壓縮.
無(wú)損壓縮:解壓后的數(shù)據(jù)可以完全復(fù)原.在常用的壓縮格式中,用的較多的都是有損壓縮.
有損壓縮:解壓后的數(shù)據(jù)不能完全復(fù)原,會(huì)丟失一部分信息.壓縮比越小,丟失的信息就會(huì)越多,信號(hào)還原的失真就會(huì)越大.
壓縮編碼的原理實(shí)際上就是壓縮冗余的信號(hào).冗余信號(hào)就是指不能被人耳感知的信號(hào).包括人耳聽覺范圍之外的音頻信號(hào)以及被掩蓋掉的音頻信號(hào).
人耳掩蓋效應(yīng):
? ? ? ? 主要表現(xiàn)在頻域掩蓋效應(yīng)與時(shí)域掩蓋效應(yīng).無(wú)論是在時(shí)域還是頻域上,被掩蓋掉的信息都認(rèn)為是冗余信息,不進(jìn)行編碼處理
? ? ? ? 掩蔽效應(yīng)指人的耳朵只對(duì)最明顯的聲音反應(yīng)敏感,而對(duì)于不明顯的聲音,反應(yīng)則較不為敏感。例如在聲音的整個(gè)頻率譜中,如果某一個(gè)頻率段的聲音比較強(qiáng),則人就對(duì)其它頻率段的聲音不敏感了。應(yīng)用此原理,人們發(fā)明了mp3等壓縮的數(shù)字音樂(lè)格式,在這些格式的文件里,只突出記錄了人耳朵較為敏感的中頻段聲音,而對(duì)于較高和較低的頻率的聲音則簡(jiǎn)略記錄,從而大大壓縮了所需的存儲(chǔ)空間。在人們欣賞音樂(lè)時(shí),如果設(shè)備對(duì)高頻響應(yīng)得比較好,則會(huì)使人感到低頻響應(yīng)不好,反之亦然。
3、無(wú)損編碼、無(wú)損壓縮編碼和有損壓縮編碼有什么區(qū)別?
1.無(wú)損編碼
? ? ? ? 從本質(zhì)上講是無(wú)壓縮的音頻,可以獲得更好的音頻質(zhì)量,并覆蓋人耳可以聽到的全部頻率。
? ? ? ? 未壓縮音頻文件最大的缺點(diǎn)是它的大小,一般一首歌曲通常在25-40 MB之間。一些便攜式音樂(lè)播放器或設(shè)備可能不支持未壓縮的音頻格式。
優(yōu)點(diǎn):沒(méi)有壓縮,無(wú)損,完整的音頻,對(duì)計(jì)算機(jī)性能上的占用小,更容易在后期工作中使用
缺點(diǎn):文件很大,有些便攜式設(shè)備可能不支持它
無(wú)損壓縮編碼
? ? ? ? “無(wú)損壓縮”這個(gè)名字可能聽起來(lái)像是一個(gè)矛盾的事情。我更喜歡將其解釋為“節(jié)省空間的無(wú)損”。它先將音樂(lè)文件壓縮,然后在播放過(guò)程中解壓縮。這樣可以縮小文件大小,但音頻質(zhì)量仍然無(wú)損,可實(shí)現(xiàn)全頻率播放。
? ? ? ? 無(wú)損壓縮音頻文件,可以是無(wú)損音頻文件的1/2到1/3,甚至更小。無(wú)損壓縮文件的缺點(diǎn),是它更占計(jì)算機(jī)性能(與未壓縮和壓縮的有損相比。)它們還需要更多的計(jì)算機(jī)運(yùn)算來(lái)進(jìn)行解碼。
優(yōu)點(diǎn):文件較小,無(wú)損
缺點(diǎn):更占計(jì)算機(jī)性能
有損壓縮
? ? ? ? 壓縮有損音頻格式,可能是你在聽音樂(lè)時(shí)使用的最常見的音頻文件。(例如.MP3和.AAC。)這是因?yàn)閴嚎s的有損音頻文件在便攜式設(shè)備中具有最大的支持,并且它們具有最小的文件大?。ㄒ馕吨憧梢栽诟〉目臻g中,存儲(chǔ)更多的歌曲。)
? ? ? 但是,所有壓縮都需要付出代價(jià),與無(wú)損格式相比,有限的頻率范圍和明顯的音頻偽像,使音質(zhì)大打折扣。有損壓縮的音頻文件,也不適合音樂(lè)循環(huán),因?yàn)榫幗獯a器在文件的開頭和結(jié)尾添加了短空格,循環(huán)會(huì)產(chǎn)生卡頓。
優(yōu)點(diǎn):最小的文件大小,廣泛的播放支持
缺點(diǎn):有損,音質(zhì)差,不適合后期處理和編輯
當(dāng)涉及到剪輯使用音頻格式時(shí),盡可能使用.WAV或.AIFF等未壓縮格式是最好的選擇。
4.常見的音頻格式
無(wú)損的文件格式: .WAV,.AIFF
無(wú)損壓縮文件格式: .FLAC,ALAC(Apple Lossless)
有損壓縮文件式: .MP3,.AAC,.WMA,.OGG
WAV編碼格式
WAV編碼的一種實(shí)現(xiàn)方式(其實(shí)它有非常多實(shí)現(xiàn)方式,但都是不會(huì)進(jìn)行壓縮操作).就是在源PCM數(shù)據(jù)格式的前面加上44個(gè)字節(jié).分別用來(lái)描述PCM的采樣率,聲道數(shù),數(shù)據(jù)格式等信息.
特點(diǎn):音質(zhì)非常好。
適合場(chǎng)合:多媒體開發(fā)的中間文件,保存音樂(lè)和音效素材
MP3編碼格式
MP3編碼具有不錯(cuò)的壓縮比,而且聽感也接近于WAV文件,當(dāng)然在不同的環(huán)境下,應(yīng)該調(diào)整合適的參數(shù)來(lái)達(dá)到更好的效果.
特點(diǎn):音質(zhì)在128Kbit/s以上表現(xiàn)不錯(cuò),壓縮比比較高.大量軟件和硬件都支持.兼容性高.
適合場(chǎng)合:高比特率下對(duì)兼容性有要求的音樂(lè)欣賞.
AAC編碼格式
AAC是目前比較熱門的有損壓縮編碼技術(shù),并且衍生了LC-AAC,HE-AAC,HE-AAC v2 三種主要編碼格式.
LC-AAC 是比較傳統(tǒng)的AAC,主要應(yīng)用于中高碼率的場(chǎng)景編碼(>= 80Kbit/s)
HE-AAC 主要應(yīng)用于低碼率場(chǎng)景的編碼(<= 48Kbit/s)
特點(diǎn):在小于128Kbit/s的碼率下表現(xiàn)優(yōu)異,廣泛應(yīng)用于互聯(lián)網(wǎng)視頻中
適合場(chǎng)景:于128Kbit/s以下的音頻編碼,多用于互聯(lián)網(wǎng)視頻中的音頻軌的編碼
Ogg編碼格式
Ogg編碼是一種非常有潛力的編碼,在各種碼率下都有比較優(yōu)秀的表現(xiàn).尤其在低碼率場(chǎng)景下.Ogg除了音質(zhì)好之外,Ogg的編碼算法也是非常出色.可以用更小的碼率達(dá)到更好的音質(zhì).128Kbit/s的Ogg比192Kbit/s甚至更高碼率的MP3更優(yōu)質(zhì).但目前由軟件還是硬件支持問(wèn)題,都沒(méi)法達(dá)到與MP3的使用廣度.
特點(diǎn):可以用比MP3更小的碼率實(shí)現(xiàn)比MP3更好的音質(zhì),高中低碼率下均有良好的表現(xiàn),兼容不夠好,流媒體特性不支持.