Openvino包含了一個(gè)ASR demo,展示了如何基于Kaldi神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型進(jìn)行推理。但是該Demo只能接受Kaldi的ARK文件,所以無(wú)法覆蓋端到端的語(yǔ)音識(shí)別(語(yǔ)音到文字),因此需要額外的前處理(特征提?。┘磸恼Z(yǔ)音信號(hào)中得到特征向量,也需要后處理(解碼)即從評(píng)分中產(chǎn)生文本。

Intel speech library
Openvino包含了一個(gè)ASR demo,展示了如何基于Kaldi神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型進(jìn)行推理。但是該Demo只能接受Kaldi的ARK文件,所以無(wú)法覆蓋端到端的語(yǔ)音識(shí)別(語(yǔ)音到文字),因此需要額外的前處理(特征提?。┘磸恼Z(yǔ)音信號(hào)中得到特征向量,也需要后處理(解碼)即從評(píng)分中產(chǎn)生文本。