
IGV基因組瀏覽器
輸入文件有:物種基因組序列文件、物種基因組注釋文件、轉(zhuǎn)錄本比對(duì)后的BAM文件;
以斑胸草雀為例:
-基因組注釋文件: GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf
-基因組序列文件: GCF_003957565.2_bTaeGut1.4.pri_genomic.fna
-轉(zhuǎn)錄本比對(duì)文件: myBAMfile.bam
文件內(nèi)容一覽:
samtools view myBAMfile.bam | less -S 查看BAM文件內(nèi)容

bam文件內(nèi)容
第一步提取BAM文件
如果要查看所有轉(zhuǎn)錄本的比對(duì)情況基本是不現(xiàn)實(shí)的(一般上百G),受限于電腦性能無(wú)法加載這么大的bam文件,所以查看reads的比對(duì)情況一般通過(guò)提取出map到基因組的其中一個(gè)Scaffold的所有reads的bam文件。
示例從BAM文件提取斑胸草雀轉(zhuǎn)錄本比對(duì)到Scaffold NC_007897.1 的所有reads
samtools sort -@ 24 -o myBAMfile.sort.bam myBAMfile.bam && #bam文件排序
samtools index -@ 24 myBAMfile.sort.bam && #對(duì)排序后的bam建立索引
samtools view myBAMfile.sort.bam NC_007897.1 -O BAM -o NC_007897.1.bam && #提取比對(duì)到 NC_007897.1 Scaffold 的reads輸出到NC_007897.1.bam
echo "FINISHED"
第二步用IGV瀏覽器瀏覽提取的reads的比對(duì)情況
打開(kāi)IGV瀏覽器,首先載入基因組文件,點(diǎn)擊Genomes選擇加載本地基因組,導(dǎo)入GCF_003957565.2_bTaeGut1.4.pri_genomic.fna文件

加載基因組
然后選擇File點(diǎn)擊Load from file選擇加載本地gtf文件,導(dǎo)入GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf

加載基因組注釋文件
創(chuàng)建基因組索引

image.png

image.png
加載BAM文件

image.png

image.png

image.png

image.png

image.png
工作目錄下的 *.bam.bai 文件就是創(chuàng)建好的bam索引,重新加載BAM文件

image.png
定位到基因組Scaffold位置,即可瀏覽比對(duì)到該Scaffold的所有reads

reds顏色標(biāo)識(shí)
根據(jù)reads名定位序列,reads窗格右鍵選擇select by names... 輸入序列名即可實(shí)現(xiàn)定位

reads定位