1、軟件配置KneadData
conda activate meta_qc
conda install kneaddata
# KneadData會自動安裝Trimmomatic, Bowtie2等依賴
2、宿主基因組下載
# 創(chuàng)建數(shù)據(jù)庫目錄
mkdir -p genome_database
# 下載基因組數(shù)據(jù)庫 (這個命令會下載并解壓,需要一些時間)
kneaddata_database --download human_genome bowtie2 genome_database/#這個軟件直接帶的
#沒有豬的基因組,KneadData 自帶的 kneaddata_database --download ... 只提供少數(shù)“常用宿主”(人/鼠/狗/貓等),沒有豬很正常。解決辦法就是:自己準(zhǔn)備豬參考序列并做 Bowtie2 索引
#這個和轉(zhuǎn)錄組通用了,可以用fa自己構(gòu)建(以前做chip我寫過教程),也可以去官網(wǎng)下載

去官網(wǎng)下載的.png
3、腳本跑
#!/bin/bash
db_path="/home/shpc_101389/wang_proj/genome_database/Sscrofa11.1/Sscrofa11.1"
cleandata="/home/shpc_101389/wang_proj/yang_data/cleandata"
kneaddata="/home/shpc_101389/wang_proj/yang_data/kneaddata"
mkdir -p "$kneaddata"
cd "$cleandata"
for forward_file in *_clean_1.fastq.gz; do
base_name=${forward_file%_clean_1.fastq.gz}
reverse_file="${base_name}_clean_2.fastq.gz"
output_dir="${kneaddata}/${base_name}" # 每個樣本獨(dú)立輸出目錄
mkdir -p "$output_dir"
echo "正在用KneadData處理樣本:$base_name ..."
kneaddata \
-i1 "$forward_file" \
-i2 "$reverse_file" \
-o "$output_dir" \
-db "$db_path" \
-t 12 \
-v \
--output-prefix "$base_name" \
--bowtie2-options "--very-sensitive --dovetail" \
--bypass-trim \
--remove-intermediate-output &
done
wait
echo "所有樣本的KneadData分析已完成!"