如何將轉(zhuǎn)錄組數(shù)據(jù)mapping到自己的序列并可視化?(HISAT2+Samtools+IGV)

? ? ? ? 以小編自己最近在做的HBV mapping為例,前期的環(huán)境部署及軟件安裝找時(shí)間再細(xì)說(shuō),直接進(jìn)入主題,如下:

前期準(zhǔn)備:

Linux以及Windows操作系統(tǒng),HISAT2、Samtools以及IGV等軟件的安裝,fastq文件

操作步驟:

1. 在NCBI中找到HBV genotypeD的序列并下載sequence.gb以及sequence.fa格式文件。


2. 使用HISAT2構(gòu)建HBV genome的Index,命名為HBVgenotypeD。

extract_exons.py sequence.gb > exons.txt

extract_splice_sites.py sequence.gb > splicesites.txt

hisat2-build --s splicesites.txt --exon exons.txt PATH/sequence.fa HBVgenotypeD

3. 采用HISAT2進(jìn)行mapping獲得sam文件,命名為HBVmaping.sam。

hisat2 -p 8 --dta -x PATH/ HBVgenotypeD -1 HBV_R1.fastq.gz -2 HBV_R2.fastq.gz -S HBVmaping.sam

5. 采用Samtools將sam文件sort為bam文件,命名為HBVmaping.bam。

samtools sort -@ 8 -o HBVmaping.bam HBVmaping.sam

6. 對(duì)bam文件建立index。

samtools index HBVmaping.bam

7. 打開IGV,genome——load genome from file,選擇sequence.fa;File——load from file,選擇HBVmaping.bam。結(jié)果如下:

大功告成!


怎么樣,是不是很簡(jiǎn)單呢?快來(lái)試一試吧!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容