音頻開發(fā) -- 音頻基礎(chǔ)

一、音頻播放流程

音樂播放器在播放音頻時的流程:
1.讀入音頻文件,使用解碼器將各種格式的音頻文件解壓,還原為原始的音頻流。此階段音質(zhì)受解碼器影響,當(dāng)采用無損音頻格式時不受任何影響。
2.對音頻流進行預(yù)處理、均衡器、聲音特效等操作。此階段音質(zhì)受播放軟件、音效插件等影響。
3.將處理結(jié)果輸出至聲卡,由聲卡進行數(shù)模轉(zhuǎn)換,輸出音頻信號。此階段音質(zhì)受硬件影響,包括聲卡、功放電路、播放設(shè)備等。

二、常見音頻格式

音頻文件的生成過程是將聲音信息采樣、量化和編碼產(chǎn)生數(shù)字信號的過程,人耳所能聽到的聲音,是從最低的頻率20HZ一直到最高的頻率20KHZ,因此音頻文件格式的最大帶寬是20KHZ。根據(jù)奈奎斯特的理論,只有采樣頻率高于聲音信號最高頻率的兩倍時,才能把數(shù)字信號表示的聲音還原成為原來的聲音,所以音頻文件的采樣率一般在40~50KHZ,比如最常見的CD音質(zhì)采樣率44.1KHZ。

對聲音進行采樣、量化過程被稱為脈沖編碼調(diào)制(Pulse Code Modulation),簡稱PCM。PCM數(shù)據(jù)是最原始的音頻數(shù)據(jù),完全無損,所以PCM數(shù)據(jù)雖然音質(zhì)優(yōu)秀但體積龐大,為了解決這個問題先后誕生了一系列的音頻格式,這些音頻格式運用不同的方法對音頻數(shù)據(jù)進行壓縮,其中有無損壓縮和有損壓縮兩種。

  • 無損音頻格式:WAV
  • 無損壓縮音頻格式:APE、FLAC
    能夠在保存原文件的所有數(shù)據(jù)的前提下,將音頻文件的體積壓縮的更小,而將壓縮后的音頻文件還原后,能夠?qū)崿F(xiàn)與源文件相同的大小、相同的碼率。
  • 有損壓縮音頻格式:MP3、WMA、OGG
    有損音樂是利用了人類對聲波中的某些頻率成分不敏感的特性,允許音頻數(shù)據(jù)壓縮過程中損失一定的信息,雖然不能完全恢復(fù)原始數(shù)據(jù),卻換來了大得多的壓縮比,可以極大減少存儲空間。

常見音頻格式

三、MP3文件結(jié)構(gòu)

目前最為常用的音頻格式是MP3,MP3是一種有損壓縮的音頻格式,設(shè)計這種格式的目的就是為了大幅度的減小音頻的數(shù)據(jù)量,它舍棄PCM音頻數(shù)據(jù)中人類聽覺不敏感的部分。

MP3格式中的碼率(BitRate)代表了MP3數(shù)據(jù)的壓縮質(zhì)量,現(xiàn)在常用的碼率有128kbit/s、160kbit/s、320kbit/s等,這個值越高聲音質(zhì)量也就越高。MP3編碼方式常用的有兩種固定碼率(Constant bitrate,CBR)和可變碼率(Variable bitrate,VBR)。MP3格式中的數(shù)據(jù)通常由兩部分組成,一部分為ID3用來存儲歌名、演唱者、專輯、音軌數(shù)等信息,另一部分為音頻數(shù)據(jù)。音頻數(shù)據(jù)部分以幀(frame)為單位存儲,每一個幀都有自己的幀頭,其中存儲了采樣率等解碼必須的信息,所以每一個幀都可以獨立于文件存在和播放,這個特性加上高壓縮比使得MP3文件成為了音頻流播放的主流格式。幀頭之后存儲著音頻數(shù)據(jù),這些音頻數(shù)據(jù)是若干個PCM數(shù)據(jù)幀經(jīng)過壓縮算法壓縮得到的,對CBR的MP3數(shù)據(jù)來說每個幀中包含的PCM數(shù)據(jù)幀是固定的,而VBR是可變的。

MP3文件結(jié)構(gòu)1
MP3文件結(jié)構(gòu)2
MP3 tag相關(guān)

四、基本概念

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 前言: 記載資料多為網(wǎng)絡(luò)搜集,侵刪。 根據(jù)最近接觸的整機項目做了一些整機音頻相關(guān)基礎(chǔ)知識的總結(jié),如有不足或表述問題...
    Gawain_Knowknow閱讀 8,743評論 0 4
  • 概述 本片文章主要介紹音頻基礎(chǔ),在做音頻開發(fā)之前首先必須要對音頻的相關(guān)概念了解。以下是具體內(nèi)容概述: 常見的音頻格...
    iosmedia閱讀 2,974評論 0 1
  • 要在計算機內(nèi)播放或是處理音頻文件,也就是要對聲音文件進行數(shù)、模轉(zhuǎn)換,這個過程同樣由采樣和量化構(gòu)成,人耳所能聽到的聲...
    Viking_Den閱讀 10,576評論 1 10
  • 前言 本篇開始講解在Android平臺上進行的音頻編輯開發(fā),首先需要對音頻相關(guān)概念有基礎(chǔ)的認識。所以本篇要講解以下...
    Ihesong閱讀 8,064評論 2 18
  • ### YUV顏色空間 視頻是由一幀一幀的數(shù)據(jù)連接而成,而一幀視頻數(shù)據(jù)其實就是一張圖片。 yuv是一種圖片儲存格式...
    天使君閱讀 3,671評論 0 4

友情鏈接更多精彩內(nèi)容