保姆級(jí)教程:手把手教你畫出內(nèi)容豐富的基因結(jié)構(gòu)圖 (進(jìn)化樹+CDD+UTR/CDS)

寫在前面:在基因家族生信分析(二)這篇文章里,簡(jiǎn)單提到了一種基因結(jié)構(gòu)繪制的方法,當(dāng)時(shí)是跟著視頻課做筆記,沒(méi)有實(shí)際操作。直到今天實(shí)際操作了一下,發(fā)現(xiàn)有很多需要注意的地方,今天就詳細(xì)記錄一下。

正文在這:先放成果圖哈,這張基因結(jié)構(gòu)圖里分為進(jìn)化樹,CDD(保守功能結(jié)構(gòu)域),UTR/CDS(基本基因結(jié)構(gòu))三大部分。

最后的效果圖!

第一步,UTR/CDS(基本基因結(jié)構(gòu))

1)首先從擬南芥官網(wǎng)獲取GFF3文件(GFF3文件里無(wú)具體序列,是一些結(jié)構(gòu)信息)

下載完會(huì)獲得GFF3文件,如文件夾里的1

2)以WRKY家族轉(zhuǎn)錄因子為例,下載序列信息,打開plantTFDB網(wǎng)站,選擇所需物種。點(diǎn)擊WRKY家族,點(diǎn)擊Download?Sequence

plantTFDB主頁(yè)
下載完會(huì)獲得WRKY家族轉(zhuǎn)錄因子序列信息,如文件夾里的2

3)簡(jiǎn)化2里的基因名,方便后續(xù)操作

TBtools步驟
將序列名進(jìn)行簡(jiǎn)化,得到文件夾中的3

4)提取基因ID和序列(取其中30個(gè))


TBtools步驟
得到序列名稱list,如文件夾里的4
保證下面方框中輸入的基因名稱和文件3中基因名稱一致、

5)展示基本基因結(jié)構(gòu)

TBtools步驟
按步驟輸入,start,得到下圖
UTR/CDS(基本基因結(jié)構(gòu))

第二步,UTR/CDS(基本基因結(jié)構(gòu))+CDD(保守結(jié)構(gòu)域)

1)打開NCBI的CD?search:一鍵直達(dá),然后找到Batch?CD-search,進(jìn)行批量分析。

分析完成后,Download得到文件夾里的6

2)打開hitdata.txt(這里要用excel打開)。

其中Query列信息需要分列處理一下

3)將Query列信息分列,是為了獲取對(duì)應(yīng)的基因ID。

分列步驟圖

4)將From,To,Short?Name?列信息同樣復(fù)制到Sheet2,得到我們所需的信息。(ps. 這里保存的話,就沒(méi)有sheet2了,而是直接變成了hitdata.txt,但是信息仍然是處理過(guò)的,影響不大)

sheet2里有我們需要的所有信息

5)展示基因結(jié)構(gòu)

還是這個(gè)步驟
右邊的參數(shù)框錯(cuò)了,應(yīng)該是選下面兩個(gè)哦。輸入的信息略有變化,得到下圖
UTR/CDS(基本基因結(jié)構(gòu))+CDD(保守結(jié)構(gòu)域)

第三步,UTR/CDS(基本基因結(jié)構(gòu))+CDD(保守結(jié)構(gòu)域)+進(jìn)化樹

1)這里就是用mega做一個(gè)進(jìn)化樹,然后保存為netwick格式(文件8),這個(gè)就不講了,不會(huì)的可以關(guān)注公眾號(hào)私信我,給你發(fā)教程哈。

TBtools步驟
,左圖是進(jìn)化樹,右圖是結(jié)果圖

需要注意的是,當(dāng)你把.nwk文件導(dǎo)入并作圖,出來(lái)的基因順序是根據(jù)進(jìn)化樹順序排列的,但是是倒序,如上圖中紅框部分本來(lái)在最上面,生成圖片之后就跑到了最下面。

進(jìn)化樹生成pdf(文件9)

基因結(jié)構(gòu)圖同樣導(dǎo)出成pdf,將這兩個(gè)圖片用AI編輯,把你的進(jìn)化樹水平翻轉(zhuǎn)一下,然后調(diào)好間距、顏色、blabla,然后保存,就可以得到一開始的效果圖啦!


不過(guò)時(shí)至今日,基因結(jié)構(gòu)繪制功能已經(jīng)有了加強(qiáng)版,看著就很厲害,可惜我還不會(huì)用,害,慢慢學(xué)習(xí),加油!有哪個(gè)小伙伴會(huì)的話也可以教教我呀哈哈哈。

推薦版本

為了方便大家練習(xí),我把做這張圖用到的文件都打包在一個(gè)文件夾了,微信搜索“今天吃了橙子”,回復(fù)”結(jié)構(gòu)圖“即可快速獲取哦~

今日份奧利給:一個(gè)人要像一支隊(duì)伍,對(duì)著自己的頭腦和心靈招兵買馬,不氣餒,有召喚,愛(ài)自由(,早日SCN)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容