step2 宿主基因組去除

1、軟件配置KneadData

conda activate meta_qc
conda install kneaddata
# KneadData會自動安裝Trimmomatic, Bowtie2等依賴

2、宿主基因組下載

# 創(chuàng)建數(shù)據(jù)庫目錄
mkdir -p genome_database
# 下載基因組數(shù)據(jù)庫 (這個命令會下載并解壓,需要一些時間)
kneaddata_database --download human_genome bowtie2 genome_database/#這個軟件直接帶的
#沒有豬的基因組,KneadData 自帶的 kneaddata_database --download ... 只提供少數(shù)“常用宿主”(人/鼠/狗/貓等),沒有豬很正常。解決辦法就是:自己準(zhǔn)備豬參考序列并做 Bowtie2 索引
#這個和轉(zhuǎn)錄組通用了,可以用fa自己構(gòu)建(以前做chip我寫過教程),也可以去官網(wǎng)下載
去官網(wǎng)下載的.png

3、腳本跑


#!/bin/bash
db_path="/home/shpc_101389/wang_proj/genome_database/Sscrofa11.1/Sscrofa11.1"
cleandata="/home/shpc_101389/wang_proj/yang_data/cleandata"
kneaddata="/home/shpc_101389/wang_proj/yang_data/kneaddata"
mkdir -p "$kneaddata"

cd "$cleandata"
for forward_file in *_clean_1.fastq.gz; do
    base_name=${forward_file%_clean_1.fastq.gz}
    reverse_file="${base_name}_clean_2.fastq.gz"
    output_dir="${kneaddata}/${base_name}"   # 每個樣本獨(dú)立輸出目錄
    mkdir -p "$output_dir"

    echo "正在用KneadData處理樣本:$base_name ..."

    kneaddata \
        -i1 "$forward_file" \
        -i2 "$reverse_file" \
        -o "$output_dir" \
        -db "$db_path" \
        -t 12 \
        -v \
        --output-prefix "$base_name" \
        --bowtie2-options "--very-sensitive --dovetail" \
        --bypass-trim \
        --remove-intermediate-output &
done

wait
echo "所有樣本的KneadData分析已完成!"
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容