音頻變速 | libsonic 開源庫(kù)的介紹與實(shí)踐

在做音視頻編輯的時(shí)候,大家關(guān)注更多的是視頻開發(fā),熱衷于 FFmpeg、OpenGL 這些技巧,實(shí)際上音頻開發(fā)也是很重要的,甚至可以說音頻開發(fā)比視頻開發(fā)更難一點(diǎn)。

對(duì)音頻的常見處理就是變速、變調(diào)、混音這些,一般都是用開源庫(kù)來搞定,常見的就是 libsonic 和 libsoundtouch 兩個(gè),當(dāng)然有實(shí)力的公司會(huì)自己研發(fā)音頻算法。

本篇文章會(huì)簡(jiǎn)單介紹 libsonic 的使用。

libsonic 獲取

libsonic 是一個(gè)支持音頻倍速播放的開源庫(kù),并且支持大于 2 倍速的播放,它的主頁(yè)地址如下:

https://android.googlesource.com/platform/external/sonic/+/refs/heads/master/doc/index.md

可以通過該鏈接下載 libsonic 庫(kù):

git clone git://github.com/waywardgeek/sonic.git

這個(gè)倉(cāng)庫(kù)里面內(nèi)容還挺全的,包含了 Java 和 C 版本的實(shí)現(xiàn)和使用演示,很方便做移植。

image

如果你只需要用到變速和音量調(diào)整,那么使用 sonic_lite.h 和 sonic_lite.c 兩個(gè)文件就行了,這里面對(duì)功能做了裁剪。

libsonic 主頁(yè)上還提供了一個(gè) Android NDK 版本的倉(cāng)庫(kù),通過該鏈接可下載:

git clone git://github.com/waywardgeek/sonic-ndk.git

不過這個(gè)版本有的太老舊了,還是 Android.mk 的接入方式,現(xiàn)在都換成 CMake 接入了。

有興趣的同學(xué)可以寫一個(gè) sonic-ndk CMake 版本的封裝庫(kù),說不定能在 Github 上刷一波 star 呢。

libsonic 使用

libsonic 的調(diào)用接口不多,具體使用完全可以參考給的代碼演示。

以下是一個(gè)音頻倍速的使用代碼:

/* Run sonic_lite. */
static void runSonic(char* inFileName, char* outFileName, float speed, float volume) {
  waveFile inFile, outFile = NULL;
  // 定義輸入和輸出的 buffer 
  short inBuffer[SONIC_INPUT_SAMPLES], outBuffer[SONIC_INPUT_SAMPLES];
  int samplesRead, samplesWritten, sampleRate, numChannels;
  // 打開輸入文件,并且獲取輸入文件的相關(guān)信息
  inFile = openInputWaveFile(inFileName, &sampleRate, &numChannels);
  if (numChannels != 1) {
    fprintf(stderr, "sonic_lite only processes mono wave files.  This file has %d channels.\n",
        numChannels);
    exit(1);
  }
  if (sampleRate != SONIC_SAMPLE_RATE) {
    fprintf(stderr,
        "sonic_lite only processes wave files with a sample rate of %d Hz.  This file uses %d\n",
        SONIC_SAMPLE_RATE, sampleRate);
    exit(1);
  }
  if (inFile == NULL) {
    fprintf(stderr, "Unable to read wave file %s\n", inFileName);
    exit(1);
  }
  // 打開輸出文件
  outFile = openOutputWaveFile(outFileName, sampleRate, 1);
  if (outFile == NULL) {
    closeWaveFile(inFile);
    fprintf(stderr, "Unable to open wave file %s for writing\n", outFileName);
    exit(1);
  }
  // 初始化 sonic 并且設(shè)置速度 speed 和音量 volume 
  sonicInit();
  sonicSetSpeed(speed);
  sonicSetVolume(volume);
  do {
   // 從輸入文件中讀取 sample
    samplesRead = readFromWaveFile(inFile, inBuffer, SONIC_INPUT_SAMPLES);
    if (samplesRead == 0) {
      sonicFlushStream();
    } else {
      // 將讀取的 sample 給到 sonic 中的 sonicStream
      // sonicStream 會(huì)根據(jù) speed 和 volume 做相應(yīng)處理
      sonicWriteShortToStream(inBuffer, samplesRead);
    }
    // 將 sonic 中 sonicStream 處理后的數(shù)據(jù)給到 outBuffer
    // 并將 outBuffer 寫入到輸出文件中
    do {
      samplesWritten = sonicReadShortFromStream(outBuffer, SONIC_INPUT_SAMPLES);
      if (samplesWritten > 0) {
        writeToWaveFile(outFile, outBuffer, samplesWritten);
      }
    } while (samplesWritten > 0);
  } while (samplesRead > 0);
  closeWaveFile(inFile);
  closeWaveFile(outFile);
}

這個(gè)代碼示例還是比較簡(jiǎn)單易懂的。

首先是檢查輸入和輸出文件是不是有問題,這一點(diǎn)很基礎(chǔ)但也非常重要。

代碼中用到的示例文件是 wav 格式的,libsonic 倉(cāng)庫(kù)中有對(duì)應(yīng)的資源可以下載,不用自己滿世界找文件了。

wav 文件的讀取可以用倉(cāng)庫(kù)中的 wave.c 和 wave.h 文件操作。

接下來就是從輸入文件中讀取 sample ,并交由 libsonic 處理,最后將處理好 sample 寫入到輸出文件中。

這有個(gè)概念就是:視頻的處理,我們都是說一幀一幀的,音頻就沒有幀的概念,一般都是說采樣點(diǎn),比如要處理多少個(gè)采樣點(diǎn)之類的說法。

代碼示例中,readFromWaveFile 方法從文件中讀取 sample ,sonicWriteShortToStream 方法將 sample 交由 libsonic 處理。

libsonic 中有個(gè) sonicStream 的結(jié)構(gòu),它用來存儲(chǔ)變換后的數(shù)據(jù),這里面會(huì)根據(jù)設(shè)置的 speed 和 volume 做處理。

最后再通過 sonicReadShortFromStream 將數(shù)據(jù)從 libsonic 讀出,然后通過 writeToWaveFile 方法寫入到輸出文件中。

經(jīng)過測(cè)試,以上方法確實(shí)可以實(shí)現(xiàn)音量調(diào)節(jié)和變速的效果,并且在變速的同時(shí)保持著原來的音調(diào)。

小結(jié)

以上就是關(guān)于 libsonic 的介紹與實(shí)踐,除了 wav 格式文件,pcm 格式數(shù)據(jù)也同樣可以做變速的。

關(guān)注公眾號(hào) 音視頻開發(fā)進(jìn)階 ,在后續(xù)還會(huì)進(jìn)行更新源碼分析等更多內(nèi)容,敬請(qǐng)期待~~~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容