保姆級教程:手把手教你畫出內(nèi)容豐富的基因結構圖 (進化樹+CDD+UTR/CDS)

寫在前面:在基因家族生信分析(二)這篇文章里,簡單提到了一種基因結構繪制的方法,當時是跟著視頻課做筆記,沒有實際操作。直到今天實際操作了一下,發(fā)現(xiàn)有很多需要注意的地方,今天就詳細記錄一下。

正文在這:先放成果圖哈,這張基因結構圖里分為進化樹,CDD(保守功能結構域),UTR/CDS(基本基因結構)三大部分。

最后的效果圖!

第一步,UTR/CDS(基本基因結構)

1)首先從擬南芥官網(wǎng)獲取GFF3文件(GFF3文件里無具體序列,是一些結構信息)

下載完會獲得GFF3文件,如文件夾里的1

2)以WRKY家族轉(zhuǎn)錄因子為例,下載序列信息,打開plantTFDB網(wǎng)站,選擇所需物種。點擊WRKY家族,點擊Download?Sequence

plantTFDB主頁
下載完會獲得WRKY家族轉(zhuǎn)錄因子序列信息,如文件夾里的2

3)簡化2里的基因名,方便后續(xù)操作

TBtools步驟
將序列名進行簡化,得到文件夾中的3

4)提取基因ID和序列(取其中30個)


TBtools步驟
得到序列名稱list,如文件夾里的4
保證下面方框中輸入的基因名稱和文件3中基因名稱一致、

5)展示基本基因結構

TBtools步驟
按步驟輸入,start,得到下圖
UTR/CDS(基本基因結構)

第二步,UTR/CDS(基本基因結構)+CDD(保守結構域)

1)打開NCBI的CD?search:一鍵直達,然后找到Batch?CD-search,進行批量分析。

分析完成后,Download得到文件夾里的6

2)打開hitdata.txt(這里要用excel打開)。

其中Query列信息需要分列處理一下

3)將Query列信息分列,是為了獲取對應的基因ID。

分列步驟圖

4)將From,To,Short?Name?列信息同樣復制到Sheet2,得到我們所需的信息。(ps. 這里保存的話,就沒有sheet2了,而是直接變成了hitdata.txt,但是信息仍然是處理過的,影響不大)

sheet2里有我們需要的所有信息

5)展示基因結構

還是這個步驟
右邊的參數(shù)框錯了,應該是選下面兩個哦。輸入的信息略有變化,得到下圖
UTR/CDS(基本基因結構)+CDD(保守結構域)

第三步,UTR/CDS(基本基因結構)+CDD(保守結構域)+進化樹

1)這里就是用mega做一個進化樹,然后保存為netwick格式(文件8),這個就不講了,不會的可以關注公眾號私信我,給你發(fā)教程哈。

TBtools步驟
,左圖是進化樹,右圖是結果圖

需要注意的是,當你把.nwk文件導入并作圖,出來的基因順序是根據(jù)進化樹順序排列的,但是是倒序,如上圖中紅框部分本來在最上面,生成圖片之后就跑到了最下面。

進化樹生成pdf(文件9)

基因結構圖同樣導出成pdf,將這兩個圖片用AI編輯,把你的進化樹水平翻轉(zhuǎn)一下,然后調(diào)好間距、顏色、blabla,然后保存,就可以得到一開始的效果圖啦!


不過時至今日,基因結構繪制功能已經(jīng)有了加強版,看著就很厲害,可惜我還不會用,害,慢慢學習,加油!有哪個小伙伴會的話也可以教教我呀哈哈哈。

推薦版本

為了方便大家練習,我把做這張圖用到的文件都打包在一個文件夾了,微信搜索“今天吃了橙子”,回復”結構圖“即可快速獲取哦~

今日份奧利給:一個人要像一支隊伍,對著自己的頭腦和心靈招兵買馬,不氣餒,有召喚,愛自由(,早日SCN)。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容