SEED數據庫簡介及使用

SEED是什么

SEEDFellowship for Interpretation of Genomes (FIG)在2003年發(fā)起的一項無資金支持的的開源項目。該項目的核心目的是開發(fā)一種更準確、更大規(guī)模的基因組注釋技術,并利用該技術對前1000個測序基因組提供更好的注釋。該項目是建立在這樣一個原則之上的:提高高通量注釋技術準確性的關鍵是讓專家注釋整個基因組集合上的單個Subsystem,而不是讓注釋專家試圖注釋單個基因組中的所有基因。Subsystems技術是SEED項目成員為了對上千個基因組提供統(tǒng)一而準確的注釋所提出和開發(fā)的。

A subsystem is a set of functional roles that an annotator has decided should be thought of as related. Frequently, subsystems represent the collection of functional roles that make up a metabolic pathway, a complex (e.g., the ribosome), or a class of proteins (e.g., two-component signal-transduction proteins within Staphylococcus aureus).

使用Subsystems方法,Subsystem中的所有基因由將由該Subsystem的專家進行分析校正,從而保證注釋的準確性。subsystems發(fā)展的詳細過程見https://theseed.org/wiki/Annotating_1000_genomes。
現在,SEED是一個不斷更新的分析環(huán)境和基因組數據的集合,包括基因組數據、subsystems、FIGfams (蛋白家族)、網頁前臺、API和分析腳本等。已被很多科學家用以預測基因功能和發(fā)現新的代謝路徑。

SEED使用

SEED-Viewer

Subsystem Overview

目前(2020.08)SEED一共有1358個完整的Subsystems。在此網站上能夠查看不同Subsystem的具體內容。
image.png

RAST Annotation Server
RAST (Rapid Annotation using Subsystem Technology) 是一個用于注釋完整或幾乎完整的細菌和古細菌基因組的全自動流程。能為位于系統(tǒng)發(fā)育樹中不同位置的基因組提供高質量的基因組注釋。
FIGfams(蛋白家族數據集),是RAST對新的基因組進行快速注釋的核心。FIGfams的創(chuàng)建和使用方式如下圖所示:

FIGfams的創(chuàng)建和使用方式

RAST提供基因組在線注釋服務,簡單使用流程如下:

  1. 注冊賬號


  2. 登錄之后上傳自己的基因組序列(fasta文件)


  3. 填寫基因組的物種信息


  4. 參數選擇



    這一步可以選擇構建代謝模型(Build metabolic model),可用以后續(xù)分析。

  5. 完成上傳,等待結果


  6. 查看subsystem注釋結果



  7. 查看代謝模型




    這一步會跳轉到ModelSEED的網站,在這個網站上可以查看自己的基因組中注釋到的各種反應、代謝物、基因和代謝通路等。還能基于構建的代謝模型,進行FBA分析和Gap filling。

更多RAST的使用教程,可以訪問https://rast.nmpdr.org/

ModelSEED
ModelSEED一直是基于微生物或植物基因組的注釋信息構建基因組尺度代謝模型的重要資源。ModelSEED現在包括33978種化合物和36645種反應,可在https://modelseed.org和KBase上進行搜索查看。

除了通過RAST網站構建基因組尺度的代謝模型外,在ModelSEED網站,也可以通過上傳基因組序列進行代謝模型的構建和分析。

Metagenomics RAST Server
使用跟RAST相同的技術,SEED還提供了宏基因組的分析注釋服務。


具體分析流程如下:

參考資料
https://theseed.org/wiki/Home_of_the_SEED

Overbeek R, Begley T, Butler RM, et al. The subsystems approach to genome annotation and its use in the project to annotate 1000 genomes. Nucleic Acids Research. 2005;33:5691–5702.

Meyer Folker, Overbeek Ross, Rodriguez Alex. FIGfams: yet another set of protein families. Nucleic Acids Research. 2009;37(20):6643–6654.

Aziz RK, Bartels D, Best AA, et al. The RAST server: rapid annotations using subsystems technology. BMC Genomics. 2008;9:75.

https://github.com/ModelSEED/ModelSEEDDatabase

Meyer, F., Paarmann, D., D'Souza, M. et al. The metagenomics RAST server – a public resource for the automatic phylogenetic and functional analysis of metagenomes. BMC Bioinformatics 2008;9:386.

?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容