[音頻壓縮]音頻編解碼 1

目前音頻收集的流程

image.png

1 模擬信號(hào) -> 數(shù)字信號(hào) (ADC Analog to Digital Conversion)

image.png

每個(gè)點(diǎn)的數(shù)據(jù)都轉(zhuǎn)換為 電子信號(hào) (Binary 2~16bits)

image.png

2 采樣(Sample) 范圍

  • 一般是 44100HZ
    每兩個(gè)采樣點(diǎn) 間隔 大概是 1000ms / 44100Hz ~ 23us(微秒)

  • 為什么現(xiàn)在的設(shè)備不能無限放大,理論上可以1us 一個(gè)采樣

    • 那是因?yàn)?這會(huì)導(dǎo)致文件非常大
    • 同時(shí) 人耳對音頻信號(hào)的平均感知能力為 50us長度,或者最高20000hz精度
  • 為什么是44100HZ 而不是 46000HZ
    因?yàn)樵缙诘腃D最大容納采樣為44100HZ

  • 為什么不是20000hz 正好適配人耳
    因?yàn)?奈奎斯特抽樣定理

要從抽樣信號(hào)中無失真地恢復(fù)原信號(hào),抽樣頻率應(yīng)大于2倍信號(hào)最高頻率。

奈奎斯特抽樣定理 :要從抽樣信號(hào)中無失真地恢復(fù)原信號(hào),抽樣頻率應(yīng)大于2倍信號(hào)最高頻率。 抽樣頻率小于2倍頻譜最高頻率時(shí),信號(hào)的頻譜有混疊。 抽樣頻率大于2倍頻譜最高頻率時(shí),信號(hào)的頻譜無混疊。

3 采樣深度精度

例如 ADC過程 將Analog轉(zhuǎn)換為Digital信號(hào) 可以取不同的范圍區(qū)間,例如00-01 或者 00-11

image.png

但是如何才可以準(zhǔn)確 保留信號(hào) 并且還原的區(qū)間

image.png
  • 比特深度 以CD為例,按照16bits
image.png
  • 這個(gè)過程 ADC 稱為 量化
image.png
  • 將bits分配給每個(gè)值 稱為 脈沖編碼調(diào)制(Pulse code modulation)
image.png
  • 但是更高質(zhì)量音頻信號(hào),比特深度范圍更大 例如 24~36bits

其實(shí)和 視頻HDR 10bits和 SDR 8bits差不多

image.png

4 壓縮

未壓縮的 60s的 LR雙省道 16bits 44100hz 大概是10.5MB

原始數(shù)據(jù) 10.5MB/min

  • MP3 -> 2.4MB/min (有損壓縮 Lossy)
    (和視頻幀內(nèi)壓縮同理 去掉人耳不擅長聽出來的 高頻數(shù)據(jù))
    (例如去掉音量特別小的數(shù)據(jù)、音調(diào)特別高的)

  • Lossless無壓縮編碼

    • Flac
    • Alac
      主要通過重復(fù)數(shù)據(jù)壓縮編碼(熵編碼、殘差編碼)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容