環(huán)狀RNA的識(shí)別包含了序列比對(duì)和環(huán)狀RNA預(yù)測(cè)兩步,該軟件目前更新到了v2版本,相比v1版本,用法有較大變化。在v1版本中只支持tophat-fusion和STAR兩款軟件進(jìn)行序列比對(duì)來識(shí)別junction reads,在v2版本中,擴(kuò)展到了以下5種軟件
- TopHat2/TopHat-Fusion
- STAR
- BWA
- MapSplice
- segemehl
原理

- Align用于將序列比對(duì)到參考基因組上;
- Parse用于從比對(duì)結(jié)果中挑選junction reads;
- Annotate用于預(yù)測(cè)環(huán)狀RNA;
- Assemble用于組裝環(huán)狀RNA的轉(zhuǎn)錄本序列;
- Denovo根據(jù)序列組裝結(jié)果,識(shí)別新的環(huán)狀RNA和分析環(huán)狀RNA上的可變剪切事件
安裝
- pip install circexplorer2
- conda install circexplorer2 --channel bioconda
該軟件分為以下5個(gè)功能模塊:
- Align:用于將序列比對(duì)到參考基因組上
- Parse:用于從比對(duì)結(jié)果中挑選junction reads
- Annotate:用于預(yù)測(cè)環(huán)狀RNA
- Assemble:用于組裝環(huán)狀RNA的轉(zhuǎn)錄本序列
- Denovo:根據(jù)序列組裝結(jié)果,識(shí)別新的環(huán)狀RNA和分析環(huán)狀RNA上的可變剪切事件
使用方法
1. Align
雖然支持多款序列比對(duì)軟件,但是由于tophat的結(jié)果更方便后續(xù)的cufflinks軟件進(jìn)行分析,官方推薦使用tophat來進(jìn)行比對(duì)。針對(duì)單端序列的比對(duì),代碼如下
CIRCexplorer2 align \
-G hg19.gtf \
-i bowtie1_index \
-j bowtie2_index \
-f RNA_seq.fastq \
> CIRCexplorer2_align.log
值得注意的是,align模塊僅提供了針對(duì)單端序列使用tophat進(jìn)行比對(duì)的功能,如果你是雙端測(cè)序的結(jié)果或者想要使用其他軟件,只能是自己手工進(jìn)行比對(duì),這里比較推薦STAR軟件,速度較快,缺點(diǎn)就是內(nèi)存消耗較大。
2. parse
parse用于解析序列比對(duì)的結(jié)果,支持多款軟件,以常用的STAR為例,代碼如下
CIRCexplorer2 parse \
-t STAR \
Chimeric.out.junction \
> CIRCexplorer2_parse.log
對(duì)于其他軟件的用法,具體請(qǐng)參考官方文檔,無論是什么比對(duì)軟件,該命令最終都會(huì)生成以下文件
back_spliced_junction.bed
3. annotation
這一步就是根據(jù)已知的線性轉(zhuǎn)錄本信息,識(shí)別環(huán)狀RNA,所以需要提供參考基因組對(duì)應(yīng)的注釋文件,官方也提供了腳本來幫助我們下載,用法如下
fetch_ucsc.py hg19 ref hg19_ref.txt
預(yù)測(cè)環(huán)狀RNA的代碼如下
CIRCexplorer2 annotate \
-r hg19_ref.txt \
-g hg19.fa \
-b back_spliced_junction.bed \
-o circularRNA_known.txt \
> CIRCexplorer2_annotate.log
-o參數(shù)為輸出結(jié)果,內(nèi)容示意如下

每列的含義如下所示

如果你只是想要使用這個(gè)軟件來預(yù)測(cè)環(huán)狀RNA,那么多款序列比對(duì)軟件都可以選擇,但是你想要使用完整功能,則必須使用tophat來進(jìn)行比對(duì)。
參考資料: