trimmomatic安裝
trimmomatic是用JAVA編寫的程序,將軟件下載解壓后就可直接使用
cd /home/llt/software
wget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.38.zip
unzip Trimmomatic-0.38.zip
trimmomatic使用
trimmomatic的用法可以參考官方手冊http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/TrimmomaticManual_V0.32.pdf
運行trimmomatic需要制定軟件目的。我的原始數(shù)據(jù)是雙端測序生成的,具有上下游兩個文件。采用雙末端模式運行
java -jar /home/llt/software/Trimmomatic-0.38/trimmomatic-0.38.jar PE -threads 4 /home/llt/test/data/raw/SRR1976948_1.fastq.gz /home/llt/test/data/raw/SRR1976948_2.fastq.gz SRR1976948_1p SRR1976948_1u SRR1976948_2p SRR1976948_2u ILLUMINACLIP:/home/llt/software/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:4:20 LEADING:10 TRAILING:10 MINLEN:100
java -jar /home/llt/software/Trimmomatic-0.38/trimmomatic-0.38.jar , 運行java程序
PE ,雙末端模式
-threads 4 ,四線程
/home/llt/test/data/raw/SRR1976948_1.fastq.gz /home/llt/test/data/raw/SRR1976948_2.fastq.gz ,雙端測序的兩個序列文件
SRR1976948_1p SRR1976948_1u SRR1976948_2p SRR1976948_2u ,四個輸出文件:兩個成對的 clean data, 未成對的正向序列以及未成對的反向序列
ILLUMINACLIP ,這是用來去除接頭的步驟。這部分指定 2 種去接頭模式的參數(shù):/home/llt/software/Trimmomatic-0.38/adapters/TruSeq2-PE.fa指明需要匹配的接頭文件,2 代表 接頭序列與測序序列中可以有 2 個錯配,30 代表采用回文模式時匹配得分至少為30 (約50個堿基),10 代表采用簡單模式時匹配得分至少為10 (約17 個堿基)
SLIDINGWINDOW:4:20,從 5' 端開始以 4 bp 的窗口計算堿基平均質(zhì)量,如果此平均值低于 20,則從這個位置截斷 read
LEADING:10,從序列的開頭開始去掉質(zhì)量值小于 20 的堿基
TRAILING:10,從序列的末尾開始去掉質(zhì)量值小于 20 的堿基
MINLEN:100, 如果 reads 長度小于 100 bp 則扔掉整條 read