寫(xiě)在前面
????最近碰到點(diǎn)需求,了解一下其他植物的病害和抗性基因,于是檢索了生物互作數(shù)據(jù)庫(kù),發(fā)現(xiàn)了Phibase和prgdb這兩個(gè)網(wǎng)站,做個(gè)簡(jiǎn)單的介紹。
1. Phibase
website:http://www.phi-base.org/index.jsp
????收錄了經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證或文獻(xiàn)報(bào)道的能夠感染植物、動(dòng)物、真菌和昆蟲(chóng)的真菌、卵菌、細(xì)菌等病原菌的致病基因、毒力基因和效應(yīng)蛋白基因。另外,還收錄了抗真菌化合物及其靶基因。

????這個(gè)數(shù)據(jù)庫(kù)于2019年發(fā)表在NAR,最近的一次更新在2021年9月1日,內(nèi)容上可以說(shuō)是非常新了。
1.1 想查看該網(wǎng)站收錄了哪些病原菌、宿主及病害名稱(chēng)。
分別對(duì)應(yīng)左側(cè)的Pathogen、Hosts、Dieases,可以直接下載excel表格到本地查看。
1.2 根據(jù)宿主名或基因名稱(chēng)或功能檢索
search-(advanced search,精確搜索需要advanced search,否則不需要),輸入你想檢索的信息就可。
比如我想搜索已報(bào)道的能侵染玉米的病害,我直接輸入‘Zea mays’,然后拿到18頁(yè)的信息。

第一列是已報(bào)道的致病基因名,第二列是表型,第三列是來(lái)源的病原菌,第四列是造成的病害部位,第五列是宿主。
把這部分信息download下來(lái),用R語(yǔ)言的table()函數(shù)統(tǒng)計(jì)一下。
de <- read.table('maize-deasease.txt',sep = '\t',header = F)
dee <- de[,c(-1,-6)]
colnames(dee) <- c('geneid','function','pathogen','organ')
#統(tǒng)計(jì)病害并作圖
library(ggplot2)
ta <- as.data.frame(table(dee$pathogen))
ggplot(ta,aes(Var1,Freq))+
geom_bar(stat="identity",fill="steelblue")+
geom_text(mapping = aes(label = ta$Freq), size = 6, colour = 'red', vjust = 0.5)+#給柱狀圖數(shù)值添加label
theme(axis.text.x = element_text(angle = 45, hjust = 0.5, vjust = 0.5)) #調(diào)整橫軸label為45度

可以看到,研究的最多的是玉米的瘤黑粉病,其次是玉米的小斑病。
1.3 下載網(wǎng)站所有的effector信息
downd按鈕,有兩種格式,CSV格式和FASTA格式任君挑選,不過(guò)下載之前要填寫(xiě)基本信息來(lái)注冊(cè),很快的。
1.4 對(duì)未知序列進(jìn)行病菌基因?qū)ふ一蛲椿驅(qū)ふ?/h3>
PHI-Blast
不過(guò)只能做少數(shù)的數(shù)目,如果要搜索的數(shù)目太多,倒不如下載所有的基因組信息,本地做blast。
2. PRGDB
website:http://prgdb.crg.eu/wiki/Main_Page

這個(gè)用法就比較簡(jiǎn)單,你可以根據(jù)物種名,R基因類(lèi)型名稱(chēng)搜索已報(bào)道的R基因。美中不足的是,這個(gè)網(wǎng)站自2014年就沒(méi)再更新,因此信息可能有點(diǎn)陳舊。
參考鏈接
1.http://lib.mimazi.net/bioinf/112.html
2.https://mp.weixin.qq.com/s?__biz=MzA5NzQzOTgzMw==&mid=2650828558&idx=1&sn=56a798b6dedd5421ccc9673700e8d692&chksm=8b541638bc239f2e16998740dbaeee96568d9943c23310e0d94ec6aa012796c0cc9cf3e9e780&scene=21