介紹
Trim Galore是自動(dòng)檢測(cè)轉(zhuǎn)錄組數(shù)據(jù)adapter的質(zhì)控軟件。cutadapt軟件可以對(duì)NGS數(shù)據(jù)進(jìn)行質(zhì)量過(guò)濾,F(xiàn)astQC軟件可以查看NGS數(shù)據(jù)的質(zhì)量分布,trim_galore將這兩個(gè)軟件封裝到一起,使用起來(lái)更加的方便。
安裝
conda install trim-galore
使用
trim_galore -q 20 --phred33 --stringency 3 --length 20 -e 0.1 \
? ? ? ? ? ? --paired $dir/cmp/01raw_data/$fq1 $dir/cmp/01raw_data/$fq2? \
? ? ? ? ? ? --gzip -o $input_data
參數(shù)說(shuō)明:
--quality(-q):設(shè)定Phred quality score閾值,默認(rèn)為20。
--phred33::選擇-phred33或者-phred64,表示測(cè)序平臺(tái)使用的Phred quality score。
--adapter:輸入adapter序列。也可以不輸入,Trim Galore!會(huì)自動(dòng)尋找可能性最高的平臺(tái)對(duì)應(yīng)的adapter。自動(dòng)搜選的平臺(tái)三個(gè),也直接顯式輸入這三種平臺(tái),即--illumina、--nextera和--small_rna。
--stringency:設(shè)定可以忍受的前后adapter重疊的堿基數(shù),默認(rèn)為1(非常苛刻)??梢赃m度放寬,因?yàn)楹笠粋€(gè)adapter幾乎不可能被測(cè)序儀讀到。
--length:設(shè)定輸出reads長(zhǎng)度閾值,小于設(shè)定值會(huì)被拋棄。
--paired:對(duì)于雙端測(cè)序結(jié)果,一對(duì)reads中,如果有一個(gè)被剔除,那么另一個(gè)會(huì)被同樣拋棄,而不管是否達(dá)到標(biāo)準(zhǔn)。
--retain_unpaired:對(duì)于雙端測(cè)序結(jié)果,一對(duì)reads中,如果一個(gè)read達(dá)到標(biāo)準(zhǔn),但是對(duì)應(yīng)的另一個(gè)要被拋棄,達(dá)到標(biāo)準(zhǔn)的read會(huì)被單獨(dú)保存為一個(gè)文件。
--gzip和--dont_gzip:清洗后的數(shù)據(jù)zip打包或者不打包。
--output_dir (-o):輸入目錄。需要提前建立目錄,否則運(yùn)行會(huì)報(bào)錯(cuò)。
-- trim-n : 移除read一端的reads