WildCARD_data數(shù)據(jù)預(yù)處理時(shí)報(bào)錯(cuò):'utf-8' codec can't decode byte 0x8b in position 1

在使用CARD數(shù)據(jù)庫(kù)時(shí),針對(duì)宏基因組數(shù)據(jù),需要另外下載WildCARD_data,下載完成后需對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,才可以使用。
在進(jìn)行數(shù)據(jù)預(yù)處理時(shí),出現(xiàn)了報(bào)錯(cuò)信息:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1: invalid start byte

wget -O wildcard_data.tar.bz2 https://card.mcmaster.ca/latest/variants
mkdir -p wildcard
tar -xvf wildcard_data.tar.bz2 -C wildcard
rgi wildcard_annotation -i wildcard --card_json ./card.json -v 3.0.8 > wildcard_annotation.log 2>&1
- 出現(xiàn)報(bào)錯(cuò),報(bào)錯(cuò)信息如下:
ERROR: UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 1:
invalid start byte in codecs.py line 322
- 查閱資料,發(fā)現(xiàn)是字符編碼的問題,0x8b說明是gzip壓縮過的數(shù)據(jù)
- 進(jìn)入wildcard文件夾,里面的fasta數(shù)據(jù)都是壓縮形式的:card-genomes.txt.gz
- 解決方法:
cd wildcard
gunzip *.gz 
rgi wildcard_annotation -i wildcard --card_json ./card.json -v 3.0.8 > wildcard_annotation.log 2>&1
- WELL DONE
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容