都2020年了,我不允許你不會(huì)用phytozome數(shù)據(jù)庫

嗨嗨,好久不見,太久沒有更新啦。前幾天和老師討論實(shí)驗(yàn)的時(shí)候,他提到了這個(gè)數(shù)據(jù)庫挺方便,之前只是聽說過,沒有研究過怎么用,回來之后我就仔細(xì)看了下,今天順便記錄一些基本操作哈。

首先,phytozome是一個(gè)收錄了植物基因組的數(shù)據(jù)庫和在線工具,注釋信息、基因組數(shù)據(jù)的獲取、可視化瀏覽都十分方便。

1.數(shù)據(jù)下載

作為一個(gè)數(shù)據(jù)庫,其最最主要的功能就是提供?數(shù)據(jù)的下載?,作為一個(gè)有原則的網(wǎng)站,phytozome要求你注冊(cè)后才能下載它的數(shù)據(jù),所以乖乖注冊(cè)。

選擇你需要的物種,以擬南芥為例,annotation?注釋文件夾,assembly?組裝文件夾。

我們比較常用的有這幾種

不清楚這些文件是干啥的,請(qǐng)翻閱往期文章:

基因家族生信分析基礎(chǔ),基礎(chǔ)到教你序列下載的那種基礎(chǔ)?。ㄒ唬?/a>

基因家族生信分析基礎(chǔ),基礎(chǔ)到教你序列下載的那種基礎(chǔ)?。ǘ?/a>

2.批量提取基因序列

選擇物種應(yīng)該不用多說,比較方便的是?keywords?部分可以輸入基因功能,家族名稱,某個(gè)結(jié)構(gòu)域等等都可以,然后GO。

3.單個(gè)基因檢索

主頁Tools——Keywords?search——選家族(可自行輸入或點(diǎn)選下方樹狀圖),輸入關(guān)鍵詞,GO。

于是我們先來看看基本信息,點(diǎn)G。

1.Functional Annotation:根據(jù)Pfam數(shù)據(jù)庫呈現(xiàn)出蛋白結(jié)構(gòu)域等部分。

2.Genomic:該基因在基因組上的位置,可視化一下外顯子內(nèi)含子啥的。

3.Sequences:這一部分我個(gè)人覺得挺有用,UTR等位置都標(biāo)注的很清楚。

4.Protein?Homologs:同源蛋白,顯示該蛋白在其他物種里的一些同源蛋白及其基本信息等,起碼和NCBI比起來,這個(gè)網(wǎng)站速度快很多哈。

5.Gene?Ancestry:基因進(jìn)化相關(guān)信息等。

6.Expression:可以查看該基因收錄在不同文獻(xiàn)中的表達(dá)情況(expression),還可以查看與該基因呈現(xiàn)共表達(dá)情況的相關(guān)基因(coexpression),correlation則表示共表達(dá)程度,非常好用。

至于點(diǎn)擊B,就可以直接看到基因可視化信息,如下圖,放大縮小啥的自己多點(diǎn)點(diǎn)就明白了。

4.啟動(dòng)子序列的獲取

在上一步的3.sequences中點(diǎn)開Genomic?sequence,輸入你需要的長度參數(shù),可以直接獲取上下游序列。

5.Blast查找同源基因或者檢測引物特異性

可參考文章:論引物特異性的重要性,順便帶你看懂花花綠綠的結(jié)果,方法大同小異,相信你能搞定。

最后,如果沒看明白本教程還可以直奔網(wǎng)課:植物基因組數(shù)據(jù)庫Phytozome,講的非常詳細(xì),五塊錢,兩人一起好像一塊錢,買它買它買它(無利益關(guān)系,單純推薦哈

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容