一鍵解決不同物種間的直系同源基因的轉(zhuǎn)換

一鍵解決不同物種間的直系同源基因的轉(zhuǎn)換

今天推薦一個(gè)數(shù)據(jù)庫網(wǎng)站,可以直接在網(wǎng)站上進(jìn)行轉(zhuǎn)換,比如我們就知道果蠅這個(gè)物種,他們自己的名字名命就是和別的物種不一樣,總有一些自己的叫法,讓你不知道這個(gè)基因到底在人類啊,小鼠當(dāng)中究竟是什么基因。一個(gè)一個(gè)的查非常的麻煩,這里提供一個(gè)可以提供gene list就直接轉(zhuǎn)換的網(wǎng)站。

DIOPT數(shù)據(jù)庫

直接給出數(shù)據(jù)庫的網(wǎng)址DIOPOT,目前已經(jīng)更新到了version9。

 https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl

該數(shù)據(jù)庫最早是在2011年發(fā)表在BMC bioinformatics上面。

Hu, Y., Flockhart, I., Vinayagam, A. et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics 12, 357 (2011). https://doi.org/10.1186/1471-2105-12-357

使用方法非常簡單:

  1. 選擇輸入的物種

  2. 選擇要得到的物種,或者選擇all,數(shù)據(jù)庫中包含的所有的物種的

  3. 輸入你的基因的名字或者上傳你的gene list(你能想到的一切都可以,uniprot id, ENSEMBL ID等常用的都可以)

  4. 選擇你想要的比對的方法的來源

  5. 一些額外的篩選閾值(不是必須的)


    DIOPT使用截圖.png
  6. 點(diǎn)擊提交獲得結(jié)果,可以在結(jié)果種直接選擇Best Predicted Ortholog以獲得單一的結(jié)果展示

    DIOPT結(jié)果展示.png

如果還是不會(huì)用,他們團(tuán)隊(duì)還在網(wǎng)站上放了使用的教程。

作者團(tuán)隊(duì)主要想解決的問題

  • 物種間直系同源基因的作圖在功能基因組學(xué)中發(fā)揮著重要作用,研究人員可以根據(jù)已知的其他物種中直向同源基因的功能,提出有關(guān)一個(gè)物種中基因功能的假設(shè)。有幾種預(yù)測直系同源基因關(guān)系的工具可用。然而,這些工具可能會(huì)給出不同的結(jié)果,并且預(yù)測直系同源物的識(shí)別并不總是那么簡單。

  • 分析果蠅 RNAi 篩選中心 (DRSC) 篩選結(jié)果的研究人員經(jīng)常希望識(shí)別在篩選中“命中”(陽性結(jié)果)的果蠅基因的哺乳動(dòng)物直向同源物。

  • 作者團(tuán)隊(duì)開發(fā)的DIOPT 整合了現(xiàn)有方法,有助于快速鑒定人類、小鼠、斑馬魚、線蟲、果蠅和釀酒酵母之間的直系同源物。

  • 并且目前截止到了最新的第九版的更新中,還額外的加入了岡比亞按蚊Mosquito (Anopheles gambiae),大腸桿菌 (E. coli),線蟲(Caenorhabditis elegans),擬南芥(Arabidopsis thaliana),裂殖酵母(Schizosaccharomyces pombe),非洲爪蟾(Xenopus laevis)等共12種物種之間的直系同源基因之間的轉(zhuǎn)換。

  • 已經(jīng)出現(xiàn)了許多工具來滿足識(shí)別直系同源物的需要。然而,這些工具的低覆蓋率和異質(zhì)性給科學(xué)家們帶來了障礙,他們想要識(shí)別給定感興趣基因的一個(gè)或幾個(gè)最高置信度的直系同源物,或者相反,想要撒下廣泛的網(wǎng)絡(luò)并跟進(jìn)所有可能的直系同源物,一個(gè)基因。

  • DIOPT的目標(biāo)是提供易于使用的資源,以促進(jìn)總結(jié)、比較和訪問各種直向同源預(yù)測來源。DIOPT 集成了 Ensembl Compara、HomoloGene、Inparanoid、Isobase、OMA、orthoMCL、Phylome、RoundUp 和 TreeFam 數(shù)據(jù)庫內(nèi)的直系同源預(yù)測。DIOPT 使用戶可以找到由一種、多種或所有這些已發(fā)表方法鑒定的指定基因或基因的直系同源對。這提供了一種簡化的方法,用于集成、比較和訪問源自基于序列同源性、系統(tǒng)發(fā)育樹和功能相似性的算法的直系同源預(yù)測。DIOPT 計(jì)算一個(gè)簡單的分?jǐn)?shù),指示支持給定直系同源基因?qū)﹃P(guān)系的工具數(shù)量,以及基于功能評(píng)估的加權(quán)分?jǐn)?shù),使用每個(gè)工具預(yù)測的所有果蠅-人類直系同源對的高質(zhì)量 GO 分子功能注釋。每種工具用于預(yù)測同源關(guān)系的算法的差異是一種工具與另一種工具做出的一組預(yù)測存在差異的根源之一。

    其實(shí)如果熟悉orgdb的同學(xué)們,看到這里肯定已經(jīng)想到了可以使用bitr在不同的數(shù)據(jù)庫之間進(jìn)行轉(zhuǎn)換,但是bitr只能提供從一個(gè)數(shù)據(jù)庫的名字轉(zhuǎn)移到另一個(gè)數(shù)據(jù)庫的名字的方式,并不能像DIOPT一樣提供多個(gè)數(shù)據(jù)庫之間的相互轉(zhuǎn)換,我個(gè)人也覺得這個(gè)是這個(gè)數(shù)據(jù)庫最厲害的點(diǎn),而且對于 wet lab的同學(xué)們更加的友好。

  • DIOPT 還顯示預(yù)測的直系同源對的蛋白質(zhì)和結(jié)構(gòu)域比對,包括氨基酸同一性百分比。這些應(yīng)該可以幫助您在多個(gè)可能的直向同源物中識(shí)別最合適的匹配。

一些自己的想法

  • 之前做轉(zhuǎn)錄因子名稱轉(zhuǎn)換的時(shí)候(JASPAR得到的果蠅的想轉(zhuǎn)人的),想了挺多的方法感覺轉(zhuǎn)化的效率都不高。也嘗試過bitr的方式,但是總是會(huì)損失,最后擱置了一段時(shí)間以后,突然發(fā)現(xiàn)了這個(gè)網(wǎng)站,其實(shí)早就應(yīng)該想到有人會(huì)做這種網(wǎng)站的開發(fā),果不其然也是負(fù)責(zé)flybase的團(tuán)隊(duì)的人開發(fā)的,但是那個(gè)時(shí)候卻總在想著自己造輪子,沒有很好的上網(wǎng)做搜索,從而導(dǎo)致浪費(fèi)了很多的時(shí)間。

  • 果蠅有很多做的大規(guī)模的RNAi或者敲除的文章,發(fā)表的期刊水平也是非常的高,如果把這種理解為是一種站在模式生物的角度和高度做的文章,那么,怎么能夠多的利用這些資源,對于做非模式生物的研究來說,尤其是其他的昆蟲相關(guān)的研究,真的是一個(gè)很好的資源。哪怕只是在讀文獻(xiàn)的時(shí)候,能把這里的A基因和我們做的B基因快速的連接起來,這也對我來說省了很多力氣了。至少不用去做blast再去確定這個(gè)基因到底是不是我想的那個(gè)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容