寫在前面:在基因家族生信分析(二)這篇文章里,簡單提到了一種基因結構繪制的方法,當時是跟著視頻課做筆記,沒有實際操作。直到今天實際操作了一下,發(fā)現(xiàn)有很多需要注意的地方,今天就詳細記錄一下。
正文在這:先放成果圖哈,這張基因結構圖里分為進化樹,CDD(保守功能結構域),UTR/CDS(基本基因結構)三大部分。

第一步,UTR/CDS(基本基因結構)
1)首先從擬南芥官網(wǎng)獲取GFF3文件(GFF3文件里無具體序列,是一些結構信息)

2)以WRKY家族轉(zhuǎn)錄因子為例,下載序列信息,打開plantTFDB網(wǎng)站,選擇所需物種。點擊WRKY家族,點擊Download?Sequence


3)簡化2里的基因名,方便后續(xù)操作


4)提取基因ID和序列(取其中30個)



5)展示基本基因結構



第二步,UTR/CDS(基本基因結構)+CDD(保守結構域)
1)打開NCBI的CD?search:一鍵直達,然后找到Batch?CD-search,進行批量分析。

2)打開hitdata.txt(這里要用excel打開)。

3)將Query列信息分列,是為了獲取對應的基因ID。

4)將From,To,Short?Name?列信息同樣復制到Sheet2,得到我們所需的信息。(ps. 這里保存的話,就沒有sheet2了,而是直接變成了hitdata.txt,但是信息仍然是處理過的,影響不大)

5)展示基因結構



第三步,UTR/CDS(基本基因結構)+CDD(保守結構域)+進化樹
1)這里就是用mega做一個進化樹,然后保存為netwick格式(文件8),這個就不講了,不會的可以關注公眾號私信我,給你發(fā)教程哈。


需要注意的是,當你把.nwk文件導入并作圖,出來的基因順序是根據(jù)進化樹順序排列的,但是是倒序,如上圖中紅框部分本來在最上面,生成圖片之后就跑到了最下面。

基因結構圖同樣導出成pdf,將這兩個圖片用AI編輯,把你的進化樹水平翻轉(zhuǎn)一下,然后調(diào)好間距、顏色、blabla,然后保存,就可以得到一開始的效果圖啦!
不過時至今日,基因結構繪制功能已經(jīng)有了加強版,看著就很厲害,可惜我還不會用,害,慢慢學習,加油!有哪個小伙伴會的話也可以教教我呀哈哈哈。

為了方便大家練習,我把做這張圖用到的文件都打包在一個文件夾了,微信搜索“今天吃了橙子”,回復”結構圖“即可快速獲取哦~
今日份奧利給:一個人要像一支隊伍,對著自己的頭腦和心靈招兵買馬,不氣餒,有召喚,愛自由(,早日SCN)。