CVTE在線識(shí)別搭建(效果很差)

在src/online2bin輸入以下命令: ./online2-wav-nnet3-latgen-faster --do-endpointing=false --online=false --feature-type=fbank --fbank-config=../../egs/cvte/s5/conf/fbank.conf --max-active=7000 --beam=15.0 --lattice-beam=6.0 --acoustic-scale=1.0 --word-symbol-table=../../egs/cvte/s5/exp/chain/tdnn/graph/words.txt ../../egs/cvte/s5/exp/chain/tdnn/final.mdl ../../egs/cvte/s5/exp/chain/tdnn/graph/HCLG.fst 'ark:echo utter1 utter1|' 'scp:echo utter1 ../../egs/cvte/s5/data/wav/00030/2017_03_07_16.57.22_1175.wav|' ark:/dev/null

解出來的結(jié)果……呵呵呵,相當(dāng)?shù)牟粶?zhǔn),感謝kaldi群中的俊峰同學(xué)!

我認(rèn)為還得自己摸索,看看它的訓(xùn)練,用到的特征,畢竟它用了cmvn的特征,而這個(gè)在線解碼器中并沒有。(這里的在線解碼指的是輸入wav文件,輸出識(shí)別結(jié)果到控制臺(tái))

最近在摸索關(guān)鍵詞檢索,出錯(cuò)了,群主說可能是beam調(diào)的不對(duì)導(dǎo)致的lat文件出錯(cuò),但我對(duì)此抱有懷疑,beam不對(duì)只會(huì)影響效果,也會(huì)影響一些硬性的輸出嗎?有待考證。

kaldi群里和我一批的小伙伴已經(jīng)有倆放棄了,目前還有一個(gè)新認(rèn)識(shí)的,新加了一堆大神,都很謙虛柔和,很好。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容