對(duì)于生信分析,經(jīng)常需要從各種網(wǎng)址下載基因組,小編在此分享一些下載經(jīng)驗(yàn),
(1)參考文獻(xiàn):對(duì)于一個(gè)科學(xué)研究者,可以直接找到研究物種已發(fā)表的基因組文獻(xiàn),一般情況下,文章會(huì)提供基因組及注釋文件的下載鏈接,該下載鏈接是最直接最可靠的;
(2)NGDC:國(guó)家基因組科學(xué)生物中心 search,該網(wǎng)站是國(guó)內(nèi)最大的基因組數(shù)據(jù)庫(kù),可通過(guò)拉丁文或NGDC版本號(hào)查詢(xún),該網(wǎng)站除了自己的數(shù)據(jù)庫(kù),還可以搜索并跳轉(zhuǎn)到NCBI和EBI數(shù)據(jù)庫(kù),能夠同時(shí)看到三大數(shù)據(jù)庫(kù)的情況,小編建議將此搜索界面收藏,GWH為基因組及注釋?zhuān)珿SA為基因組組裝用到的原始數(shù)據(jù)

(3)NCBI:NCBI是最大相對(duì)最全的基因組下載數(shù)據(jù)庫(kù),對(duì)于生信從業(yè)者,一般首選該網(wǎng)站NCBI官網(wǎng),只需要知道物種的拉丁文名或者NCBI的版本號(hào)即可,一般需要同時(shí)有g(shù)enome跟GFF的鏈接才能使用,若沒(méi)有GFF鏈接,表明該版本在NCBI上沒(méi)有注釋文件,我們可以點(diǎn)擊Genome Assemble and Annotation report 查看其它版本,linux系統(tǒng)下載NCBI基因組可參考小編另一篇博客NCBI數(shù)據(jù)下載工具:aspera的安裝與使用

點(diǎn)擊Genome Assemble and Annotation report后可見(jiàn)如下界面,能看到研究物種各種版本基因組,最后邊的G為下載鏈接,注:下載鏈接為ftp格式,谷歌瀏覽器在國(guó)內(nèi)不支持,需要換其它瀏覽器才能打開(kāi)鏈接

(4)EBI:歐洲生物信息研究所EMBL,歐洲的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)里的基因組還有基因組注釋在NCBI一般能找的到,小編很少用

(5)JGI phytozome植物基因組數(shù)據(jù)庫(kù),該網(wǎng)站為植物基因組數(shù)據(jù)庫(kù),整理的基因組相對(duì)比較規(guī)范,使用起來(lái)比較友好,需要首先注冊(cè)官方賬號(hào),然后才可下載

(6)ensembl ensembl ftp下載鏈接 ftp://ftp.ensemblgenomes.org/pub/,該網(wǎng)站版本不斷更新,可以選擇最新版本進(jìn)行下載,該網(wǎng)站收錄的常用物種基因組,除了ftp,還可以去http里進(jìn)行下載ensembl http下載鏈接,小編沒(méi)弄明白兩個(gè)鏈接有什么不一樣,但是基因組是有差別的,要是一個(gè)鏈接找不著,可以去另一個(gè)鏈接里找


(7)GigaDB BGI華大,華大組裝的基因組,一般都存儲(chǔ)在這里,雖然是國(guó)人數(shù)據(jù)庫(kù),但該網(wǎng)站響應(yīng)非常慢,小編使用的很少,有興趣可以研究

以下給出一些小類(lèi)別數(shù)據(jù)庫(kù),持續(xù)更新中。。。
(1)柑橘基因組 該網(wǎng)站可以下載柑橘不同品種的基因組PBD
(2)葫蘆科植物基因組 CuGenDB,包括黃瓜、西瓜、南瓜、甜瓜、葫蘆
(3)棉花基因組 Gossypium New Sequence Data release,提供三種棉花基因組及基因組注釋文件
(4)薔薇科基因組GDR數(shù)據(jù)庫(kù),包括草莓、蘋(píng)果、桃、梨、玫瑰月季等

(5)番茄馬鈴薯基因組 solgenomics

(6)軟體動(dòng)物MolluscDB
