這些小bug折磨了我兩天時間才解決,決定以后跑流程要洗心革面,從原始數據就得仔仔細細欣賞,每一個參數盡量搞懂,能用google搜錯的一定不用百度。
每逢demux summarize報錯信息是醬紫的,沒看懂,就各種試錯。

image.png
最后發(fā)現(xiàn)問題是從NCBI下載的原始數據fastq有bug,每個文件最后都多了一個空行,心痛。
gunzip SRR6651857.fastq.gz #解壓
wc -l SRR6651857.fastq #發(fā)現(xiàn)都是157009行這種奇數
#后期qzv中顯示sequence counts是該數除以4
tail SRR6651857.fastq #發(fā)現(xiàn)空行
sed '157009d' SRR6651857.fastq>dSRR6651857.fastq #將最后一個空行刪除并重新輸出
gzip dSRR6651857.fastq #重新封印
重新做人版Qiime2流程
0.啟動
根據版本自行啟動
source /share/disk5/lianm/basic_tool/anaconda3/bin/activate qiime2-2019.7
source activate qiime2-2019.10
0.1.是否有barcode
補充
1.原始數據的導入(區(qū)分雙端、單端)
(1)單端
合并后導入有至少三種方式,一般下機數據選擇manifest版,但是整這個manifest文件可能會被報錯氣死。
qiime tools import --type 'SampleData[JoinedSequencesWithQuality]' --input-path manifest --output-path single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
(1)--type常見類型#qiime tools import --show-importable-types
SampleData[JoinedSequencesWithQuality]
SampleData[PairedEndSequencesWithQuality]
SampleData[SequencesWithQuality]
SampleData[Sequences]
(2)--input-format常見類型,末尾有木有V2我真不知道 # qiime tools import --show-importable-format
SingleEndFastqManifestPhred33V2
SingleEndFastqManifestPhred64V2
PairEndFastqManifestPhred33V2
PairEndFastqManifestPhred33V2
重點是manifest文件,官方說明是tab分隔,特定語法,但我仍是一直報錯,顯示case sensitive 和case insensitive的一堆,以后大批量生成應該代碼直接\t分隔
!版本1

image.png
qiime tools import --type 'SampleData[JoinedSequencesWithQuality]' --input-path /share/disk5/zhuqh/4_hospital/manifest --output-path /share/disk5/zhuqh/4_hospital/single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
qiime tools import --type 'SampleData[SequencesWithQuality]' --input-path /mnt/data/kex/hospital/manifest --output-path /mnt/data/kex/hospital/single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
#單端具體用哪個
(2)雙端
用到再補充