1.在 UCSC 下載 hg19 參考基因組;
2.從 gencode 數(shù)據(jù)庫下載基因注釋文件,并且用 IGV 去查看感興趣的基因的結(jié)構(gòu),比如TP53,KRAS,EGFR 等等。
3.截圖幾個基因的 IGV 可視化結(jié)構(gòu)
4.下載 ENSEMBL,NCBI 的 gtf,也導(dǎo)入 IGV 看看,截圖基因結(jié)構(gòu)
5.了解 IGV 常識
hg19、GRCH37、 ensembl 75 這 3 種基因組版本應(yīng)該是大家見得比較多的了,國際通用的人類參考基因組,其實(shí)他們儲存的是同樣的 fasta 序列,
只是分別對應(yīng)著三種國際生物信息學(xué)數(shù)據(jù)庫資源收集存儲單位,即 NCBI,UCSC 及ENSEMBL 各自發(fā)布的基因組信息而已。有一些參考基因組比較小眾,存儲的序列也不一樣,比如 BGI 做的炎黃基因組,還有 DNA 雙螺旋結(jié)構(gòu)提出者沃森(Watson)的基因組,還有 2016 年發(fā)表在 nature 上面的號
稱最完善的韓國人做的基因組。前期我們先不考慮這些小眾基因組,主要就下載 hg19 和 hg38,都是 UCSC 提供的,雖然 hg38 相比 hg19 來說,做
了很多改進(jìn),優(yōu)點(diǎn)也不少,但因?yàn)槟壳盀橹购芏嘧⑨屝畔⒍际轻槍τ?hg19 的坐標(biāo)系統(tǒng)來的,我們就都下載了,正好自己探究一下。也順便下載一個小鼠的最新版參考基因組吧,反正比對也就是睡個覺的功夫,順便分析一下結(jié)果,看看比對率是不是很低。(http://www.bio-info-trainee.com/1985.html)
基因組各種版本對應(yīng)關(guān)系:http://www.bio-info-trainee.com/1469.html
# 下載USCS版本的hg19
$ mkdir /home/kevin/bioinfo && /home/kevin/bioinfo/rna_seqdata
$ wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz & tar -zxvf chromFa.tar.gz# 解壓,得到所有染色體的信息
# 將所有的染色體信息整合在一起,重定向?qū)懭雋g19.fa文件,得到參考基因組
$ cat *.fa > hg19.fa
# 將多余的染色體信息文件刪除,節(jié)省空間
$ rm -rf chr*
2 下載基因組注釋文件
然而參考基因組是一部無字天書,要想解讀書中的內(nèi)容,需要額外的注釋信息協(xié)助。因此第二步,就是去gencode數(shù)據(jù)庫(http://www.gencodegenes.org/)下載基因組注釋文件
這里有基因組版本對應(yīng)信息(hg38)
https://www.gencodegenes.org/releases/19.html

下載基因組注釋文件
cd home/kevin/bioinfo/rna_seq_data/genome/hg19
wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_29/gencode.v29.annotation.gtf.gz
wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_29/gencode.v29.annotation.gff3.gz
gunzip *.gz && rm -rf *.gz
下載成功之后用less命令進(jìn)行查看
less -SN gencode.v29.annotation.gtf
成功打開GTF文件之后打開如下圖所示:
具體每一行每一列代表的含義之后會在另一篇文章中進(jìn)行具體介紹,這里不再闡述。
3 IGV(Integrative Genomics Viewer)Integrative Genomics Viewer下載和使用
igv有幾個版本

下載linux版本
IGV下載官網(wǎng):http://software.broadinstitute.org/software/igv/download
找到對應(yīng)的Linux版本,復(fù)制相應(yīng)的下載鏈接

# 進(jìn)入IGV官網(wǎng),并下載相應(yīng)的軟件包,有Windows,Mac,和LINUX,這里我下載Linux二進(jìn)制包
$ cd /home/kevin/bioinfo/software
$ wget http://data.broadinstitute.org/igv/projects/downloads/2.4/IGV_2.4.19.zip
$ unzip IGV_2.4.19.zip && mv IGV_2.4.19
# 運(yùn)行IGV,Linux在相應(yīng)的安裝目錄環(huán)境下直接運(yùn)行igv.sh可以開啟IGV窗口,但是會比較慢,要耐心等待。
cd IGV_2.4.19
$ ./igv.sh
Notice: 如果系統(tǒng)報錯,請檢查是否安裝配置了java環(huán)境

參考鏈接:
Y大寬:http://www.itdecent.cn/p/02a92e4ead4b