寫在前面:在基因家族生信分析(二)這篇文章里,簡(jiǎn)單提到了一種基因結(jié)構(gòu)繪制的方法,當(dāng)時(shí)是跟著視頻課做筆記,沒(méi)有實(shí)際操作。直到今天實(shí)際操作了一下,發(fā)現(xiàn)有很多需要注意的地方,今天就詳細(xì)記錄一下。
正文在這:先放成果圖哈,這張基因結(jié)構(gòu)圖里分為進(jìn)化樹,CDD(保守功能結(jié)構(gòu)域),UTR/CDS(基本基因結(jié)構(gòu))三大部分。

第一步,UTR/CDS(基本基因結(jié)構(gòu))
1)首先從擬南芥官網(wǎng)獲取GFF3文件(GFF3文件里無(wú)具體序列,是一些結(jié)構(gòu)信息)

2)以WRKY家族轉(zhuǎn)錄因子為例,下載序列信息,打開plantTFDB網(wǎng)站,選擇所需物種。點(diǎn)擊WRKY家族,點(diǎn)擊Download?Sequence


3)簡(jiǎn)化2里的基因名,方便后續(xù)操作


4)提取基因ID和序列(取其中30個(gè))



5)展示基本基因結(jié)構(gòu)



第二步,UTR/CDS(基本基因結(jié)構(gòu))+CDD(保守結(jié)構(gòu)域)
1)打開NCBI的CD?search:一鍵直達(dá),然后找到Batch?CD-search,進(jìn)行批量分析。

2)打開hitdata.txt(這里要用excel打開)。

3)將Query列信息分列,是為了獲取對(duì)應(yīng)的基因ID。

4)將From,To,Short?Name?列信息同樣復(fù)制到Sheet2,得到我們所需的信息。(ps. 這里保存的話,就沒(méi)有sheet2了,而是直接變成了hitdata.txt,但是信息仍然是處理過(guò)的,影響不大)

5)展示基因結(jié)構(gòu)



第三步,UTR/CDS(基本基因結(jié)構(gòu))+CDD(保守結(jié)構(gòu)域)+進(jìn)化樹
1)這里就是用mega做一個(gè)進(jìn)化樹,然后保存為netwick格式(文件8),這個(gè)就不講了,不會(huì)的可以關(guān)注公眾號(hào)私信我,給你發(fā)教程哈。


需要注意的是,當(dāng)你把.nwk文件導(dǎo)入并作圖,出來(lái)的基因順序是根據(jù)進(jìn)化樹順序排列的,但是是倒序,如上圖中紅框部分本來(lái)在最上面,生成圖片之后就跑到了最下面。

基因結(jié)構(gòu)圖同樣導(dǎo)出成pdf,將這兩個(gè)圖片用AI編輯,把你的進(jìn)化樹水平翻轉(zhuǎn)一下,然后調(diào)好間距、顏色、blabla,然后保存,就可以得到一開始的效果圖啦!
不過(guò)時(shí)至今日,基因結(jié)構(gòu)繪制功能已經(jīng)有了加強(qiáng)版,看著就很厲害,可惜我還不會(huì)用,害,慢慢學(xué)習(xí),加油!有哪個(gè)小伙伴會(huì)的話也可以教教我呀哈哈哈。

為了方便大家練習(xí),我把做這張圖用到的文件都打包在一個(gè)文件夾了,微信搜索“今天吃了橙子”,回復(fù)”結(jié)構(gòu)圖“即可快速獲取哦~
今日份奧利給:一個(gè)人要像一支隊(duì)伍,對(duì)著自己的頭腦和心靈招兵買馬,不氣餒,有召喚,愛(ài)自由(,早日SCN)。