水稻常用數(shù)據(jù)庫(kù)介紹
????近幾年隨著測(cè)序數(shù)據(jù)量呈井噴式增長(zhǎng),涌現(xiàn)出一大批優(yōu)秀的數(shù)據(jù)庫(kù)。而水稻和擬南芥分別作為植物研究中單雙子葉的模式植物,其基因組信息得到了很大程度的挖掘。下面我結(jié)合自己對(duì)水稻基因組數(shù)據(jù)庫(kù)兩年多的使用經(jīng)驗(yàn),向大家介紹一下常用的水稻基因組數(shù)據(jù)庫(kù)。如有不全之處還望大家多多指正。
1. RAP-db
[RAP-db]: https://rapdb.dna.affrc.go.jp/
????我們知道水稻有秈粳之分,粳稻由于其本身抗性較好,遺傳轉(zhuǎn)化較為容易等優(yōu)點(diǎn),受到了科研人員的青睞,粳稻中的代表性品種當(dāng)屬日本晴。這個(gè)網(wǎng)站最初由日本人創(chuàng)立,并且每年都會(huì)有更新。你可以在這個(gè)網(wǎng)站使用GBrowse查看基因的分布、根據(jù)基因號(hào)或簡(jiǎn)稱查找基因的功能和序列、使用blast搜索同源基因、使用ID Converter來(lái)轉(zhuǎn)換基因號(hào)等等。最近他們更新了秈稻Kasalath的序列,對(duì)基因分化感興趣的伙伴可以去挖掘一下。

2.MSU-RGAP
[MSU-RGAP]: http://rice.uga.edu/index.shtml
????RGAP是另一個(gè)受人們青睞的粳稻數(shù)據(jù)庫(kù),也是以日本晴作為參考基因組來(lái)注釋的。最開(kāi)始由密歇根州立大學(xué)牽頭(最近他們似乎搬到了Georgia),通過(guò)gene ID可以和RAP-db進(jìn)行基因名的轉(zhuǎn)換,還可以進(jìn)行g(shù)o和kegg的搜索。(近幾年的水稻基因組高分文章基本上都是采用的它的命名規(guī)則,我也不知道為何)

3. 秈稻注釋網(wǎng)站RIGW
[RIGW]: http://rice.hzau.edu.cn/
???與粳稻相比,秈稻的種植面積更廣,遺傳多樣性也更高。因此國(guó)內(nèi)由華中農(nóng)大牽頭,對(duì)優(yōu)良的秈稻品種珍山97(ZS97)和明恢63(MH63)構(gòu)建了高質(zhì)量的參考基因組,提供基因組學(xué),轉(zhuǎn)錄組學(xué),蛋白質(zhì) – 蛋白質(zhì)相互作用(PPIs),代謝網(wǎng)絡(luò),代謝物和計(jì)算工具等,并且還可以做CRISPR靶點(diǎn)的選擇。
4. 整合數(shù)據(jù)庫(kù)Gramene
[Gramene]: https://www.gramene.org/
?????水稻不僅秈粳分化嚴(yán)重,并且同一亞種間的分化也很嚴(yán)重,Gramene把人們研究較多的亞種各挑出一個(gè)代表來(lái)作為指示。Gramene是一個(gè)開(kāi)源的,通過(guò)比較功能基因組學(xué)整合數(shù)據(jù)資源的網(wǎng)站。這里面羅列了不同水稻亞種的基因組信息,包括普通野生稻Oryza rufipogon,印度野生稻Oryza nivara,非洲栽培稻Oryza glaberrima等等。里面有一個(gè)功能我覺(jué)得對(duì)做信號(hào)傳導(dǎo)的朋友有所幫助,稱為Plant Reactome,它會(huì)把報(bào)道的基因的信號(hào)網(wǎng)絡(luò)串聯(lián)起來(lái),形成信號(hào)網(wǎng)絡(luò),如生長(zhǎng)發(fā)育信號(hào)、次生代謝途徑、生物或非生物脅迫等。當(dāng)然了,這和大牛寫(xiě)的綜述是大同小異的,不同的是你可以在網(wǎng)站看到具體的數(shù)據(jù),而不僅僅是基因上下游的關(guān)系。
5. 3K Rice Genome Project
????由作科所牽頭,對(duì)世界范圍的3000余份水稻進(jìn)行了重測(cè)序分析,構(gòu)建了最大的水稻變異信息數(shù)據(jù)集,對(duì)水稻基因組學(xué)研究和育種應(yīng)用提供了豐富的變異資源。
Data available https://registry.opendata.aws/3kricegenome/
SNP-Seek:http://snp-seek.irri.org
交大版本:https://cgm.sjtu.edu.cn/3kricedb/index.php
6. Rice RC
Rice RC:http://ricerc.sicau.edu.cn/
????由四川農(nóng)業(yè)大學(xué)牽頭,利用nanopore、轉(zhuǎn)錄組、Hi-C等技術(shù)構(gòu)建了33個(gè)高質(zhì)量的水稻基因組,并且挖掘出其中的結(jié)構(gòu)變異和拷貝數(shù)變異,用來(lái)解釋作物的馴化、產(chǎn)量等差異,對(duì)促進(jìn)水稻育種和功能基因組學(xué)的研究具有重要的意義。
7.R498 & ZH11
Website:http://mbkbase.org/R498/
????主要記錄了秈稻R498和粳稻ZH11的基因組信息,但是從2018年開(kāi)始就沒(méi)有更新了。
后記:
????其實(shí)水稻中還有許多優(yōu)秀的種質(zhì)資源的信息,如遺傳學(xué)大牛Rod wing 發(fā)表在NG上的對(duì)野生稻的測(cè)序;國(guó)內(nèi)韓斌老師和黃學(xué)輝老師對(duì)水稻pan genome的研究等等。因篇幅有限,下次有機(jī)會(huì)再單獨(dú)聊一聊。
參考文獻(xiàn)
1.Sakai, H., Lee, SS., et al., Plant & Cell Physiol., 54(2):e6 (2013)
2.Kawahara, Y., de la Bastide, M., Hamilton J. P., Kanamori, H., McCombie, W. R., Ouyang, S., Schwartz, D. C., Tanaka, T., Wu, J., Zhou, S., Childs, K. L., Davidson, R. M., Lin, H., Quesada-Ocampo, L., Vaillancourt, B., Sakai, H., Lee, S. S., Kim, J., Numa, H., Itoh, T., Buell, C. R., Matsumoto, T. 2013. Improvement of the Oryza sativa Nipponbare reference genome using next generation sequence and optical map data. Rice 6:4
3.Song J.-M., Lei Y., Shu C.-C., Ding Y., Xing F., Liu H., Wang J., Xie W.,Zhang J., and Chen L.-L. (2017). Rice Information GateWay (RIGW): A Comprehensive Bioinformatics Platform for Indica Rice Genomes. Mol. Plant.doi: 10.1016/j.molp.2017.10.003.
4.Gramene 2018: unifying comparative genomics and pathway resources for plant research. Tello-Ruiz MK, Naithani S, Stein JC, Gupta P, Campbell M, Olson A, Wei S, Preece J, Geniza MJ, Jiao Y, Lee YK, Wang B, Mulvaney J, Chougule K, Elser J, Al-Bader N, Kumari S, Thomason J, Kumar V, Bolser DM, Naamati G, Tapanari E, Fonseca N, Huerta L, Iqbal H, Keays M, Munoz-Pomer Fuentes A, Tang A, Fabregat A, D'Eustachio P, Weiser J, Stein LD, Petryszak R, Papatheodorou I, Kersey PJ, Lockhart P, Taylor C, Jaiswal P, Ware D. Nucleic Acids Res
5.Wang, W., Mauleon, R., Hu, Z. et al. Genomic variation in 3,010 diverse accessions of Asian cultivated rice. Nature 557, 43–49 (2018). https://doi.org/10.1038/s41586-018-0063-9
6.Qin P, Lu H, Du H, Wang H, Chen W, Chen Z, He Q, Ou S, Zhang H, Li X, Li X, Li Y, Liao Y, Gao Q, Tu B, Yuan H, Ma B, Wang Y, Qian Y, Fan S, Li W, Wang J, He M, Yin J, Li T, Jiang N, Chen X, Liang C, Li S. Pan-genome analysis of 33 genetically diverse rice accessions reveals hidden genomic variations. Cell. 2021 Jun 24;184(13):3542-3558.e16. doi: 10.1016/j.cell.2021.04.046. Epub 2021 May 28. PMID: 34051138.
7.Huilong Du, Ying Yu, Yanfei Ma, Qiang Gao, Yinghao Cao, Zhuo Chen, Bin Ma, Ming Qi, Yan Li, Xianfeng Zhao, Jing Wang, Kunfan Liu, Peng Qin, Xin Yang, Lihuang Zhu, Shigui Li and Chengzhi Liang. Sequencing and de novo assembly of a near complete indica rice genome. Nature Communications