網(wǎng)絡(luò)藥理學(xué)常用數(shù)據(jù)庫(kù)(不全)

UniProt數(shù)據(jù)庫(kù)——蛋白質(zhì)數(shù)據(jù)庫(kù)

UniProt(Universal Protein)數(shù)據(jù)庫(kù)是信息最豐富、資源最廣的蛋白質(zhì)數(shù)據(jù)庫(kù)。常用的是UniProtKB,它是收集蛋白質(zhì)功能信息的中心樞紐,擁有準(zhǔn)確、一致和豐富的注釋。除了為每個(gè)UniProt條目捕獲必須的核心數(shù)據(jù)(主要是氨基酸序列、蛋白質(zhì)名稱或描述、分類數(shù)據(jù)和引文信息),還添加了盡可能多的主食信息。

UniProtKB/Swiss-Prot:高質(zhì)量的、注釋的、非冗余的數(shù)據(jù)集,這些數(shù)據(jù)都是有質(zhì)量保證的。

UniProtKB/TrEMBL:該數(shù)據(jù)集高質(zhì)量的計(jì)算分析結(jié)果,需要我們手工注釋。

Entry:是Uniprot給每個(gè)蛋白質(zhì)賦予的獨(dú)一無(wú)二的ID

Entry name:是蛋白ID的簡(jiǎn)要名字

Protein names:蛋白質(zhì)的名字

Gene names:編碼這個(gè)蛋白的Gene名字

Organism:蛋白質(zhì)的種屬來(lái)源

Length:氨基酸長(zhǎng)度

詳細(xì)信息界面,首先介紹的是「Function」,該板塊會(huì)羅列出蛋白的基本功能及參與的生物學(xué)過(guò)程,這應(yīng)該也是科研人員最關(guān)心的問(wèn)題,具體的序列和結(jié)構(gòu)只是為了方便研究或者更加深入理解蛋白的功能。每句介紹后的鏈接即是相應(yīng)的參考文獻(xiàn)(?Publications),可以根據(jù)需要點(diǎn)擊查閱?!癇y similarity”鏈接到最相似的蛋白,往往是不同種屬中的相同蛋白,也就是同源蛋白(直系同源基因是同源基因,進(jìn)化后分化形成不同的物種,這種現(xiàn)象被稱為物種形成。這些基因通常與它們進(jìn)化而來(lái)的祖先基因保持著相似的功能)。很多蛋白在進(jìn)化過(guò)程中是高度保守的,也就是說(shuō)他們的蛋白序列非常相似或者相同,這一類蛋白往往有非常強(qiáng)大的功能,參與多種生命活動(dòng)或生物學(xué)功能。

命名和來(lái)源種屬信息:(Name&Taxonomy)板塊展示的是該蛋白的名稱(基因名稱、同義詞)和來(lái)源種屬信息以及NCBI和Enzembl的基因數(shù)據(jù)庫(kù)鏈接。

亞定位(Subcellular location)包含蛋白的細(xì)胞亞定位信息。

翻譯后修飾:在(PTM/Processing)部分,UniProt數(shù)據(jù)庫(kù)會(huì)列舉蛋白合成過(guò)程中的分子加工、氨基酸修飾及翻譯后修飾,比如剪切、糖基化等。修飾過(guò)后的蛋白質(zhì)分子質(zhì)量就會(huì)增加。這也是為什么有些抗體的實(shí)際檢測(cè)分子量和預(yù)測(cè)分子量有差別的原因之一。

GeneCards基因名片數(shù)據(jù)庫(kù)(https://www.genecards.org/)GeneCards由非盈利組織構(gòu)建的一個(gè)整合型的生物信息數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)提供了人力目前已注釋的、可預(yù)測(cè)的所有基因的詳細(xì)信息,并自動(dòng)集成了來(lái)自約150個(gè)數(shù)據(jù)源的以基因?yàn)橹行牡臄?shù)據(jù),包括基因組、轉(zhuǎn)錄組、蛋白質(zhì)組、遺傳學(xué)、臨床和功能信息。

OMIM(Online Mendelian Inheritance in Man)數(shù)據(jù)庫(kù),中文稱在線人類孟德爾遺傳數(shù)據(jù)庫(kù)。OMIM側(cè)重于疾病表型與其致病基因之間的關(guān)聯(lián)。

需要注意的是:這個(gè)網(wǎng)站是于研究和教育的,注冊(cè)需要正式郵箱(我用學(xué)校郵箱注冊(cè)的)。如果Gmail,Yahoo,http://126.com,http://163.comhttp://qq.com的電子郵件地址將被網(wǎng)站自動(dòng)拒絕。

OMIM數(shù)據(jù)庫(kù)包括1.gene entry基因條目;2.allelic variations 等位基因變異;3.gene map 基因圖譜;4.phenotypic series 表型系列;5.phenotype entry 表型條目;6.clinical synopsis 臨床提要;7.external links 外部鏈接

首先在搜索條中搜索某個(gè)疾病或者基因,雙擊高亮鏈接(也就是包含關(guān)鍵詞的目的鏈接),會(huì)出現(xiàn)一個(gè)界面。


location代表相關(guān)基因在染色體中的位置;phenotype代表基因相關(guān)的表型;phenotype MIM number代表表型的MIM編號(hào);inheritance代表遺傳,是指該基因的遺傳類型,如AD是指常染色體顯性遺傳,SMu是指體細(xì)胞突變,鼠標(biāo)點(diǎn)擊縮寫符號(hào)就會(huì)出現(xiàn)不同縮寫代表的具體含義;phenotype mapping key代表表型映射關(guān)鍵,3代表該疾病的分子基礎(chǔ)是已知的;Gene/Locus代表對(duì)應(yīng)的基因或位點(diǎn);Gene/Locus MIM number代表對(duì)應(yīng)的基因或基因座MIM編號(hào)。點(diǎn)location還能顯示該位置在同一個(gè)染色體相鄰的基因列表以及引發(fā)的各種疾病.

OMIM與其說(shuō)它是個(gè)數(shù)據(jù)庫(kù),不如說(shuō)它是個(gè)工具書,它能夠讓你從基因到DNA到染色體到蛋白質(zhì)到表型全方位的去認(rèn)識(shí)一個(gè)疾病。

DisGeNET數(shù)據(jù)庫(kù)(http://www.disgenet.org/home/)

人類疾病遺傳的基礎(chǔ)是精準(zhǔn)醫(yī)學(xué)和藥物發(fā)現(xiàn)的核心。數(shù)據(jù)的可用性、碎片化、異構(gòu)性和概念描述的不一致是疾病機(jī)制研究必須克服的問(wèn)題。DisGeNET收集了大量與人類疾病相關(guān)的變異和基因。DisGeNET整合了公共數(shù)據(jù)庫(kù)、GWAS目錄、動(dòng)物模型和科學(xué)文獻(xiàn)的數(shù)據(jù)。該數(shù)據(jù)庫(kù)的數(shù)據(jù)采用了統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行注釋。此外,還提供了一些原始指標(biāo),以幫助確定基因型與表型關(guān)系的優(yōu)先級(jí)。可以通過(guò)web接口,Cytoscape應(yīng)用程序(插件)、R訪問(wèn)這些信息。DisGeNET是一個(gè)多功能平臺(tái),可用于不同的研究目的包括特定的人類疾病的分子基礎(chǔ)及其并發(fā)癥的研究,致病基因特性分析,輔助構(gòu)建藥物治療作用及藥物不良反應(yīng)假說(shuō),疾病候選基因的驗(yàn)證及文本挖掘方法的評(píng)價(jià)性能。

R Package :

在R上安裝disgenet2r包后后既可以進(jìn)行DisGeNET數(shù)據(jù)庫(kù)搜索,也可以進(jìn)行可視化。但值得注意的是該R包目前的基于?DisGeNET v5.0 (May, 2017)。安裝和使用示例如下:

安裝:

##The package,disgenet2rcan be installed usingdevtoolsfrom this repository:

library(devtools)

install_bitbucket("ibi_group/disgenet2r")

數(shù)據(jù)庫(kù)檢索示例:

##以基因?yàn)闄z索詞進(jìn)行檢索

library(disgenet2r)

gq<-disgenetGene(gene=3953,

database="ALL",

score=c(">",0.1))

##以疾病為檢索詞進(jìn)行檢索

library(disgenet2r)

dq<-disgenetDisease(disease="umls:C0028754",

database="ALL",

score=c('>',0.3))

3.Cytoscape App

安裝:

需要預(yù)裝Cytoscape,然后直接在Cytoscape安裝DisGeNET插件。


Cytoscape App主要功能就是將DisGeNET的數(shù)據(jù)用networks的形式進(jìn)行展示,主要包括以下幾個(gè)方面:

a)? ? ?Generate gene-disease networks:即基因和疾病間networks,例如HPO數(shù)據(jù)庫(kù)中Asthma基因和疾病間networks示例如下:


b)? ? ?Generate variant-disease networks:即變異和疾病間networks,示例如下

c)? ? ? Generate gene or disease projection networks:即基因-基因間或者疾病-疾病間的networks,示例如下

d)? ? ?Create networks by DisGeNET association type:即檢索某一關(guān)聯(lián)關(guān)系,并將其可視化,如下面的The CURATED GDA network for CausalMutations

e)? ? ? Create networks by disease class:對(duì)某一類疾病建立network,如下是營(yíng)養(yǎng)代謝病network

f)? ? ?Create networks by gene, disease, or variant:可以不限制具體哪兩個(gè)(基因、變異、疾?。╅g的關(guān)系,而是通過(guò)過(guò)濾條件得到network,例如可以從以下幾方面進(jìn)行過(guò)濾:Source, Association Type,Disease Class, Score。下面是以MECP為檢索詞,過(guò)濾條件為Mental Disorders時(shí)構(gòu)建的網(wǎng)絡(luò)

g)? ? ?Multiple entity search in the DisGeNET App:包括匹配某一關(guān)鍵字的疾病或者基因的元素間構(gòu)建網(wǎng)絡(luò)、基于基因/變異列表構(gòu)建網(wǎng)絡(luò)。如下圖是CTD數(shù)據(jù)庫(kù)中Alzheimer相關(guān)的基因,包含了Alzheimer的所有亞型。

DisGeNET部分作者:bioyangyang

鏈接:http://www.itdecent.cn/p/21244a67e3d1

其余內(nèi)容來(lái)自網(wǎng)絡(luò),侵刪。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容