生信筆記3-Trim Galore的安裝和使用

介紹

Trim Galore是自動(dòng)檢測(cè)轉(zhuǎn)錄組數(shù)據(jù)adapter的質(zhì)控軟件。cutadapt軟件可以對(duì)NGS數(shù)據(jù)進(jìn)行質(zhì)量過(guò)濾,F(xiàn)astQC軟件可以查看NGS數(shù)據(jù)的質(zhì)量分布,trim_galore將這兩個(gè)軟件封裝到一起,使用起來(lái)更加的方便。


安裝

conda install trim-galore


使用

trim_galore -q 20 --phred33 --stringency 3 --length 20 -e 0.1 \

? ? ? ? ? ? --paired $dir/cmp/01raw_data/$fq1 $dir/cmp/01raw_data/$fq2? \

? ? ? ? ? ? --gzip -o $input_data

參數(shù)說(shuō)明:

--quality(-q):設(shè)定Phred quality score閾值,默認(rèn)為20。

--phred33::選擇-phred33或者-phred64,表示測(cè)序平臺(tái)使用的Phred quality score。

--adapter:輸入adapter序列。也可以不輸入,Trim Galore!會(huì)自動(dòng)尋找可能性最高的平臺(tái)對(duì)應(yīng)的adapter。自動(dòng)搜選的平臺(tái)三個(gè),也直接顯式輸入這三種平臺(tái),即--illumina、--nextera和--small_rna。

--stringency:設(shè)定可以忍受的前后adapter重疊的堿基數(shù),默認(rèn)為1(非常苛刻)??梢赃m度放寬,因?yàn)楹笠粋€(gè)adapter幾乎不可能被測(cè)序儀讀到。

--length:設(shè)定輸出reads長(zhǎng)度閾值,小于設(shè)定值會(huì)被拋棄。

--paired:對(duì)于雙端測(cè)序結(jié)果,一對(duì)reads中,如果有一個(gè)被剔除,那么另一個(gè)會(huì)被同樣拋棄,而不管是否達(dá)到標(biāo)準(zhǔn)。

--retain_unpaired:對(duì)于雙端測(cè)序結(jié)果,一對(duì)reads中,如果一個(gè)read達(dá)到標(biāo)準(zhǔn),但是對(duì)應(yīng)的另一個(gè)要被拋棄,達(dá)到標(biāo)準(zhǔn)的read會(huì)被單獨(dú)保存為一個(gè)文件。

--gzip和--dont_gzip:清洗后的數(shù)據(jù)zip打包或者不打包。

--output_dir (-o):輸入目錄。需要提前建立目錄,否則運(yùn)行會(huì)報(bào)錯(cuò)。

-- trim-n : 移除read一端的reads


參考

http://www.itdecent.cn/p/7a3de6b8e503

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容