KEGG Orthology 數(shù)據(jù)庫簡介

我們經(jīng)常會使用KEGG數(shù)據(jù)庫來研究基因的功能,而在KEGG 數(shù)據(jù)庫中,直接存儲分子功能的就是KEGG Orthology 數(shù)據(jù)庫。

KEGG Orthology 簡稱KO,該數(shù)據(jù)庫中的每一條記錄用K number 唯一標(biāo)識?;谕椿蚓哂邢嗨乒δ艿募僭O(shè),把基因的功能進行了擴充。對于某個物種中功能研究的很清楚的基因,在不同的物種間搜尋該基因的同源基因,將這些同源基因定義為一個orthology, 用該基因的功能作為該orthology 的功能;這樣就將對于不同物種基因功能的研究都利用起來,提供了一個全面的研究基因功能的數(shù)據(jù)庫。

pathway,module 等數(shù)據(jù)庫都是建立在KO數(shù)據(jù)庫的基礎(chǔ)上的,KO可以說是KEGG中處于核心地位的一個數(shù)據(jù)庫,所以理解KO數(shù)據(jù)庫就特別的重要。

對于一個具體的KO來說,在這個KO下是一系列基因,這些基因可以來源于不同的物種,但是具有相同的功能。以K00161為例,對應(yīng)的同源基因的列表可以從KEGG的官網(wǎng)查詢得到,

打開這個鏈接 http://www.genome.jp/kegg/ko.html , 在查詢的文本框中輸入K number, 如下圖所示:

image

點擊Orthology table按鈕,在跳轉(zhuǎn)的頁面可以看到具體的基因列表,如下圖所示

image

在下拉列表中,還可以對物種進行篩選,比如只顯示Animals的基因。

對于已知的基因,可以直接在數(shù)據(jù)庫中檢索得到對應(yīng)的功能,那么對于新發(fā)現(xiàn)的基因,如何利用KO數(shù)據(jù)庫來研究其功能呢?

根據(jù)同源基因的定義,序列相似度在80%以上的就定義為同源基因。對于功能未知的基因,我們只需要根據(jù)序列比對查找對應(yīng)的功能已知的同源基因就可以了。

KEGG官網(wǎng)提供了一個在線的工具,BlastKOALA。這個工具基于blast 比對,將輸入的基因序列和KEGG Gene 數(shù)據(jù)庫中的序列去比對,查找最佳匹配的一個gene, 將該基因?qū)?yīng)的K number 賦予查詢的基因。

地址如下:http://www.kegg.jp/blastkoala/

1.首先在文本框中輸入帶查詢的基因的序列

image

2.設(shè)置對應(yīng)的物種信息,減少查詢的物種范圍


image

3. 根據(jù)實際情況選擇用于檢索的基因集數(shù)據(jù)庫


image

4. 最后輸入郵箱地址,提交任務(wù)就可以了


image

首先會給你的郵箱發(fā)一封郵件,你必須點擊這個郵件中的鏈接才能開始工作,當(dāng)結(jié)束后,會再發(fā)一封郵件給你,通過郵件中的鏈接就可以看到最終的分析結(jié)果。

總結(jié)

KO 數(shù)據(jù)庫是研究基因功能的基礎(chǔ)數(shù)據(jù)庫,每個KO下對應(yīng)的是一系列具有相同功能的基因,這些基因可以來源于不同的物種。

基于序列比對的原理,我們可以利用KO 數(shù)據(jù)庫來研究新基因的功能。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容