最近在使用科大訊飛的SDK 做音頻文字互轉(zhuǎn)的效果。
文字轉(zhuǎn)語音很簡單,但在處理音頻轉(zhuǎn)文字時(shí)候碰到一些問題,因此做一些簡單記錄。
在訊飛SDK 所支持的音頻文件為.pcm和.wav 格式的,因?yàn)轫?xiàng)目中本地文件是壓縮過的amr文件,所以需要對(duì)音頻文件做格式轉(zhuǎn)換。
搜索之后在git上找到可以用的庫,提供下鏈接:音頻格式轉(zhuǎn)換?
使用起來相對(duì)也比較簡單,設(shè)置輸入本地文件路徑及轉(zhuǎn)換后的文件儲(chǔ)存路徑即可,之后通過轉(zhuǎn)換后的wav格式音頻文件處理音頻轉(zhuǎn)文字即可。下面是部分代碼:
下載后將文件導(dǎo)入項(xiàng)目中:
#import "EMVoiceConverter.h" 在需要用到的地方導(dǎo)入頭文件

之后可以去對(duì)應(yīng)路徑下驗(yàn)證音頻文件類型。PS: