在做音視頻編輯的時(shí)候,大家關(guān)注更多的是視頻開發(fā),熱衷于 FFmpeg、OpenGL 這些技巧,實(shí)際上音頻開發(fā)也是很重要的,甚至可以說音頻開發(fā)比視頻開發(fā)更難一點(diǎn)。
對(duì)音頻的常見處理就是變速、變調(diào)、混音這些,一般都是用開源庫(kù)來搞定,常見的就是 libsonic 和 libsoundtouch 兩個(gè),當(dāng)然有實(shí)力的公司會(huì)自己研發(fā)音頻算法。
本篇文章會(huì)簡(jiǎn)單介紹 libsonic 的使用。
libsonic 獲取
libsonic 是一個(gè)支持音頻倍速播放的開源庫(kù),并且支持大于 2 倍速的播放,它的主頁(yè)地址如下:
https://android.googlesource.com/platform/external/sonic/+/refs/heads/master/doc/index.md
可以通過該鏈接下載 libsonic 庫(kù):
git clone git://github.com/waywardgeek/sonic.git
這個(gè)倉(cāng)庫(kù)里面內(nèi)容還挺全的,包含了 Java 和 C 版本的實(shí)現(xiàn)和使用演示,很方便做移植。

如果你只需要用到變速和音量調(diào)整,那么使用 sonic_lite.h 和 sonic_lite.c 兩個(gè)文件就行了,這里面對(duì)功能做了裁剪。
libsonic 主頁(yè)上還提供了一個(gè) Android NDK 版本的倉(cāng)庫(kù),通過該鏈接可下載:
git clone git://github.com/waywardgeek/sonic-ndk.git
不過這個(gè)版本有的太老舊了,還是 Android.mk 的接入方式,現(xiàn)在都換成 CMake 接入了。
有興趣的同學(xué)可以寫一個(gè) sonic-ndk CMake 版本的封裝庫(kù),說不定能在 Github 上刷一波 star 呢。
libsonic 使用
libsonic 的調(diào)用接口不多,具體使用完全可以參考給的代碼演示。
以下是一個(gè)音頻倍速的使用代碼:
/* Run sonic_lite. */
static void runSonic(char* inFileName, char* outFileName, float speed, float volume) {
waveFile inFile, outFile = NULL;
// 定義輸入和輸出的 buffer
short inBuffer[SONIC_INPUT_SAMPLES], outBuffer[SONIC_INPUT_SAMPLES];
int samplesRead, samplesWritten, sampleRate, numChannels;
// 打開輸入文件,并且獲取輸入文件的相關(guān)信息
inFile = openInputWaveFile(inFileName, &sampleRate, &numChannels);
if (numChannels != 1) {
fprintf(stderr, "sonic_lite only processes mono wave files. This file has %d channels.\n",
numChannels);
exit(1);
}
if (sampleRate != SONIC_SAMPLE_RATE) {
fprintf(stderr,
"sonic_lite only processes wave files with a sample rate of %d Hz. This file uses %d\n",
SONIC_SAMPLE_RATE, sampleRate);
exit(1);
}
if (inFile == NULL) {
fprintf(stderr, "Unable to read wave file %s\n", inFileName);
exit(1);
}
// 打開輸出文件
outFile = openOutputWaveFile(outFileName, sampleRate, 1);
if (outFile == NULL) {
closeWaveFile(inFile);
fprintf(stderr, "Unable to open wave file %s for writing\n", outFileName);
exit(1);
}
// 初始化 sonic 并且設(shè)置速度 speed 和音量 volume
sonicInit();
sonicSetSpeed(speed);
sonicSetVolume(volume);
do {
// 從輸入文件中讀取 sample
samplesRead = readFromWaveFile(inFile, inBuffer, SONIC_INPUT_SAMPLES);
if (samplesRead == 0) {
sonicFlushStream();
} else {
// 將讀取的 sample 給到 sonic 中的 sonicStream
// sonicStream 會(huì)根據(jù) speed 和 volume 做相應(yīng)處理
sonicWriteShortToStream(inBuffer, samplesRead);
}
// 將 sonic 中 sonicStream 處理后的數(shù)據(jù)給到 outBuffer
// 并將 outBuffer 寫入到輸出文件中
do {
samplesWritten = sonicReadShortFromStream(outBuffer, SONIC_INPUT_SAMPLES);
if (samplesWritten > 0) {
writeToWaveFile(outFile, outBuffer, samplesWritten);
}
} while (samplesWritten > 0);
} while (samplesRead > 0);
closeWaveFile(inFile);
closeWaveFile(outFile);
}
這個(gè)代碼示例還是比較簡(jiǎn)單易懂的。
首先是檢查輸入和輸出文件是不是有問題,這一點(diǎn)很基礎(chǔ)但也非常重要。
代碼中用到的示例文件是 wav 格式的,libsonic 倉(cāng)庫(kù)中有對(duì)應(yīng)的資源可以下載,不用自己滿世界找文件了。
wav 文件的讀取可以用倉(cāng)庫(kù)中的 wave.c 和 wave.h 文件操作。
接下來就是從輸入文件中讀取 sample ,并交由 libsonic 處理,最后將處理好 sample 寫入到輸出文件中。
這有個(gè)概念就是:視頻的處理,我們都是說一幀一幀的,音頻就沒有幀的概念,一般都是說采樣點(diǎn),比如要處理多少個(gè)采樣點(diǎn)之類的說法。
代碼示例中,readFromWaveFile 方法從文件中讀取 sample ,sonicWriteShortToStream 方法將 sample 交由 libsonic 處理。
libsonic 中有個(gè) sonicStream 的結(jié)構(gòu),它用來存儲(chǔ)變換后的數(shù)據(jù),這里面會(huì)根據(jù)設(shè)置的 speed 和 volume 做處理。
最后再通過 sonicReadShortFromStream 將數(shù)據(jù)從 libsonic 讀出,然后通過 writeToWaveFile 方法寫入到輸出文件中。
經(jīng)過測(cè)試,以上方法確實(shí)可以實(shí)現(xiàn)音量調(diào)節(jié)和變速的效果,并且在變速的同時(shí)保持著原來的音調(diào)。
小結(jié)
以上就是關(guān)于 libsonic 的介紹與實(shí)踐,除了 wav 格式文件,pcm 格式數(shù)據(jù)也同樣可以做變速的。
關(guān)注公眾號(hào) 音視頻開發(fā)進(jìn)階 ,在后續(xù)還會(huì)進(jìn)行更新源碼分析等更多內(nèi)容,敬請(qǐng)期待~~~