目的
NGS測(cè)序得到的短序列(read)存儲(chǔ)于Fastq文件,在經(jīng)過DNA建庫和測(cè)序之后,文件中不同read之間的順序就全部丟失了。因此,F(xiàn)astq文件中緊挨著的兩條read之間沒有任何位置關(guān)系,它們都是隨機(jī)來自于原本基因組中某個(gè)位置的短序列而已。因此我們無法判斷Fastq文件中reads間的順序關(guān)系。比對(duì)就是把每一條read分別與該物種的參考基因組或自身組裝的長序列進(jìn)行比較,然后按順序排列整齊并記錄其對(duì)應(yīng)的位置。
做法
對(duì)于沒有參考基因組的物種進(jìn)行轉(zhuǎn)錄組測(cè)序,需要首先對(duì)測(cè)序reads進(jìn)行拼接,然后才能進(jìn)行比對(duì)這一過程。

Trinity原理.png
安裝
編譯安裝:
在Trinity下載頁面下載最新版本
wget https://github.com/trinityrnaseq/trinityrnaseq/releases/download/v2.12.0/trinityrnaseq-v2.12.0.FULL.tar.gz
tar -zxvf trinityrnaseq-v2.12.0.FULL.tar.gz
# 在基本安裝目錄中通過 make來編譯安裝Trinity
Anaconda 安裝
conda activate py3
conda search trinity
conda install trinity
使用
Trinity --seqType fq --left reads_1.fq --right reads_2.fq --CPU 6 --max_memory 20G
組裝拼接結(jié)果保存在./trinity_out_dir/Trinity.fasta文件中,該結(jié)果用于后續(xù)的功能注釋和表達(dá)量計(jì)算。