1,參考腳本:
nohup /home/zxd/software/trinityrnaseq-Trinity-v2.4.0/Trinity --seqType fq --max_memory 4G --CPU 1 --samples_file ../sample.txt --SS_lib_type RF >trinity.log 2>trinity.err &
2,鏈特異性參數(shù)設(shè)不對(duì) 結(jié)果全是錯(cuò)的
一.文庫類型
轉(zhuǎn)錄組文庫構(gòu)建的時(shí)候,可以選擇鏈特異性文庫或非鏈特異性文庫。
鏈特異性文庫,我們清楚的知道得到的 reads 跟轉(zhuǎn)錄本是同向的還是反向的。
鏈特異性文庫構(gòu)建,有多種方法,最常用的就是基于 dUTP 的方法。
文庫類型有兩種表示方法。

第一種表示方法:

第二種表示方法:

二.參數(shù)設(shè)置
在數(shù)據(jù)分析中,最復(fù)雜、最容易出錯(cuò)、出錯(cuò)了影響最為嚴(yán)重的除了用錯(cuò)書記,就是搞錯(cuò)文庫類型參數(shù)了。設(shè)置錯(cuò)了可能導(dǎo)致轉(zhuǎn)錄本很短、表達(dá)量極低、比對(duì)率極低等。在數(shù)據(jù)分析的時(shí)候,一定要問清楚構(gòu)建文庫的實(shí)驗(yàn)人員。
常用軟件的參數(shù)設(shè)置如下。
1. 轉(zhuǎn)錄本拼接軟件
在進(jìn)行轉(zhuǎn)錄本拼接的時(shí)候,需要考慮鏈特異性的問題。
1.1 Trinity
非鏈特異性 默認(rèn),不需要設(shè)置
鏈特異性 參數(shù)為:—SS_lib_type ,如果使用dUTP,值為 RF
1.2 cufflinks
非鏈特異性 —library-type fr-unstranded, 默認(rèn)
鏈特異性 如果使用dUTP:—library-type fr-firststrand
2. 將 reads 比對(duì)到基因組的軟件
2.1 tophat
非鏈特異性 —library-type fr-unstranded, 默認(rèn)
鏈特異性 如果使用dUTP:—library-type fr-firststrand
2.2 hisat2
非鏈特異性 默認(rèn),不需要設(shè)置
鏈特異性 如果使用dUTP: —rna-strandness RF, 添加了該參數(shù)后,每條 reads 將在 sam 文件中出現(xiàn) XS 的tag,‘+’ ‘-’ 代表該 reads 所在的轉(zhuǎn)錄本與基因組序列的關(guān)系。
2.3 STAR
STAR 的比對(duì)中,不需要手動(dòng)設(shè)置文庫類型的參數(shù)。
3.表達(dá)定量
表達(dá)定量軟件根據(jù)比對(duì)的 sam 文件,計(jì)算 read counts,需要提供鏈特異性信息。
3.1 eXpress
非連特異性 默認(rèn),不需要設(shè)置
鏈特異性 如果使用dUTP:—rf-stranded
3.2 RSEM
RSEM 使用 --strandedness?參數(shù)設(shè)置 。
非鏈特異性 --strandedness none
鏈特異性 如果使用dUTP: --strandedness reverse
參考:本文來自 基因課,生物信息視頻課程