蛋白保守結構域和進化樹

常規(guī)的MEME和進化樹可視化,以及其它基因結構/注釋信息結合進化樹可視化,TBtools已經做的很好https://cloud.tencent.com/developer/article/1809116
但是定制化的還是不容易實現,比如我只想畫出來不同物種間某一蛋白的預測的跨膜結構域。摸索TBtools且群里求助也沒解決。算了,我用R自己畫吧。。

準備文件 :

  1. fasta格式的蛋白序列文件,去mega多序列比對后建樹,bootstrap值設置為1000;
  2. 整理TMHMM預測得到的跨膜結構域信息,如下
    tm_motif

    注意進化樹里面蛋白的名字要和結構域里面的一模一樣

下面開始畫圖

library(ggplot2)
library(gggenes)
library(ggtree)
library(aplot)
tree <- read.tree("Newick Export.nwk") # 讀入樹文件
tm <- read.table("tm.txt", header = T, sep = "\t") # 讀入結構域信息文件
p1 <- ggtree(tree) +
    geom_tiplab(size = 4) +
    geom_treescale(fontsize=4, linesize=0.5) + # 加標尺
    geom_nodelab(nudge_x = 0.7) + # 加bootstrap值
    xlim(0,15) # 名稱太長,設置一下x軸范圍以便顯示完全
p1
p2 <- ggplot(tm, aes(xmin = start, xmax = end, y=IDs, fill = type)) +
    scale_fill_manual(values = c("#e63946","#f1faee","#a8dadc"))+
    geom_gene_arrow(arrowhead_height = unit(3, "mm"),
                    arrowhead_width = unit(0, "mm"))+ # 畫結構域的函數
    theme_genes()+
    ylab(NULL) +
    theme(legend.title = element_blank(), axis.text.y = element_blank())
p2
p <- p2 %>% insert_left(p1) # 拼圖
p
image.png

至于種名斜體什么的,AI中去改吧

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
禁止轉載,如需轉載請通過簡信或評論聯系作者。

相關閱讀更多精彩內容

友情鏈接更多精彩內容