莎莎寫于2020.5.1
學(xué)校第一批返校的同學(xué)已經(jīng)解封了,我還在賓館隔離
我今天在這里立個Flag:每天都要寫簡書?
哈哈哈,可能不太現(xiàn)實(shí),但是至少今天是新的一個月的開始
要好好學(xué)習(xí)!??!
好啦,今天學(xué)習(xí)比對到參考基因組,我們拿到經(jīng)過剪切reads的數(shù)據(jù)之后,就需要比對到參考基因組,這里學(xué)習(xí)兩個軟件:hisat2和subjunc

分析流程

比對

image.png
首先需要構(gòu)建基因組索引,
① 官網(wǎng)構(gòu)建好的索引地址:ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/
官網(wǎng)上有的最好下載使用

image.png
② 可以通過hisat2-build構(gòu)建基因組索引

image.png
索引構(gòu)建好之后就可以進(jìn)行轉(zhuǎn)錄組數(shù)據(jù)的比對
(1)Hisat2
Hisat2:graph-based alignment of next generation sequencing reads to a population of genomes
Hisat2主要是用來進(jìn)行轉(zhuǎn)錄組數(shù)據(jù)的比對。
使用--help查看選項(xiàng)和參數(shù)。
image.png
使用hisat2將reads比對到參考基因組

image.png

image.png

image.png
下面是批量比對:
hisat2批處理腳本內(nèi)容:

需要兩個輸入文件:索引文件和fastq文件

image.png
MultiQC整理hisat2結(jié)果:

image.png

image.png
(2)Subjunc:http://subread.sourceforge.net/

subjunc是subread里面的一個軟件包
第一步依然是構(gòu)建基因組索引

索引文件有5.8G

image.png

image.png
第2步是使用subjunc將reads比對到參考基因組
subjunc命令運(yùn)行示例:
image.png
下面是sunbjunc批量比對所有樣本:
subjunc批處理腳本內(nèi)容
和Hisat2是一樣的
最后是用flagstat檢查比對失敗reads

image.png


