使用shell實現(xiàn)多進(jìn)程ASR解碼

對于較大的測試集,或者不支持batch解碼的解碼算法,我們可以使用將數(shù)據(jù)集分割成多個子集,使用shell的多進(jìn)程并行化處理。

# 1. 將數(shù)據(jù)集按照行數(shù)進(jìn)行分割
mkdir -p fbank/tmp # 分割后的數(shù)據(jù)都在這
split -l 10009 fbank/train_sp/format.data -d -a 2 fbank/tmp/format.data_ 
# 對format.data這個文件按照10009行為一個子集進(jìn)行分割

# 2. 將這些文件分別放在fbank/train/{00,01,02,....}下面
for x in `ls fbank/tmp`; do 
{
suffix=`echo $x|awk -F'_' '{print $NF}'` # 編號
mkdir -p fbank/train/$suffix
name=`echo $x|awk -F'_' '{print $1}'` # 文件名
cp fbank/tmp/$x fbank/train/$suffix/$name
cp fbank/train_sp/utt2dur fbank/train/$suffix/
cp fbank/train_sp/global_cmvn fbank/train/$suffix
cp fbank/train_sp/text fbank/train/$suffix
}done
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容