嗨嗨,好久不見,太久沒有更新啦。前幾天和老師討論實(shí)驗(yàn)的時(shí)候,他提到了這個(gè)數(shù)據(jù)庫挺方便,之前只是聽說過,沒有研究過怎么用,回來之后我就仔細(xì)看了下,今天順便記錄一些基本操作哈。
首先,phytozome是一個(gè)收錄了植物基因組的數(shù)據(jù)庫和在線工具,注釋信息、基因組數(shù)據(jù)的獲取、可視化瀏覽都十分方便。
1.數(shù)據(jù)下載
作為一個(gè)數(shù)據(jù)庫,其最最主要的功能就是提供?數(shù)據(jù)的下載?,作為一個(gè)有原則的網(wǎng)站,phytozome要求你注冊(cè)后才能下載它的數(shù)據(jù),所以乖乖注冊(cè)。

選擇你需要的物種,以擬南芥為例,annotation?注釋文件夾,assembly?組裝文件夾。

不清楚這些文件是干啥的,請(qǐng)翻閱往期文章:
基因家族生信分析基礎(chǔ),基礎(chǔ)到教你序列下載的那種基礎(chǔ)?。ㄒ唬?/a>
基因家族生信分析基礎(chǔ),基礎(chǔ)到教你序列下載的那種基礎(chǔ)?。ǘ?/a>
2.批量提取基因序列
選擇物種應(yīng)該不用多說,比較方便的是?keywords?部分可以輸入基因功能,家族名稱,某個(gè)結(jié)構(gòu)域等等都可以,然后GO。



3.單個(gè)基因檢索
主頁Tools——Keywords?search——選家族(可自行輸入或點(diǎn)選下方樹狀圖),輸入關(guān)鍵詞,GO。

于是我們先來看看基本信息,點(diǎn)G。

1.Functional Annotation:根據(jù)Pfam數(shù)據(jù)庫呈現(xiàn)出蛋白結(jié)構(gòu)域等部分。
2.Genomic:該基因在基因組上的位置,可視化一下外顯子內(nèi)含子啥的。
3.Sequences:這一部分我個(gè)人覺得挺有用,UTR等位置都標(biāo)注的很清楚。
4.Protein?Homologs:同源蛋白,顯示該蛋白在其他物種里的一些同源蛋白及其基本信息等,起碼和NCBI比起來,這個(gè)網(wǎng)站速度快很多哈。
5.Gene?Ancestry:基因進(jìn)化相關(guān)信息等。
6.Expression:可以查看該基因收錄在不同文獻(xiàn)中的表達(dá)情況(expression),還可以查看與該基因呈現(xiàn)共表達(dá)情況的相關(guān)基因(coexpression),correlation則表示共表達(dá)程度,非常好用。
至于點(diǎn)擊B,就可以直接看到基因可視化信息,如下圖,放大縮小啥的自己多點(diǎn)點(diǎn)就明白了。

4.啟動(dòng)子序列的獲取
在上一步的3.sequences中點(diǎn)開Genomic?sequence,輸入你需要的長度參數(shù),可以直接獲取上下游序列。

5.Blast查找同源基因或者檢測引物特異性
可參考文章:論引物特異性的重要性,順便帶你看懂花花綠綠的結(jié)果,方法大同小異,相信你能搞定。
最后,如果沒看明白本教程還可以直奔網(wǎng)課:植物基因組數(shù)據(jù)庫Phytozome,講的非常詳細(xì),五塊錢,兩人一起好像一塊錢,買它買它買它(無利益關(guān)系,單純推薦哈