R語言ggtree+msa可視化進(jìn)化樹+多序列比對(duì)的結(jié)果

這兩天看用vcf文件做單倍型網(wǎng)絡(luò)的內(nèi)容,找到了一篇plos one上的論文

論文題目是

A workflow with R: Phylogenetic analyses and visualizations using mitochondrial cytochrome b gene sequences

image.png

論文提供了完整的R語言代碼和示例數(shù)據(jù)

里面一小部分內(nèi)容是關(guān)于進(jìn)化樹的可視化展示并且關(guān)聯(lián)多序列比對(duì)的結(jié)果的。記錄下這個(gè)代碼

我自己的數(shù)據(jù)是vcf文件,論文中提供的fasta格式的文件

讀取vcf文件

library(vcfR)

vcf.example<-read.vcfR("popgenome/KiwifruitPathogenFiltered.recode.vcf")
df<-vcfR2DNAbin(vcf.example)

做進(jìn)化樹并使用ggtree可視化展示

library(ggtree)
library(ape)
dnbin<-dist.dna(df,model = "K80")
dnbin
tree<-nj(dnbin)
tree
ggtree(tree,branch.length = "none")+
  geom_tiplab()+
  #theme_tree2()+
  xlim(0,10)
image.png

關(guān)聯(lián)fasta序列內(nèi)容

這里使用到的是msa這個(gè)R包

首先是安裝

BiocManager::install("msa")
library(msa)
help(package="msa")

可視化展示

ggtree(tree)+
  xlim(0,0.1)+
  geom_tiplab(align = T) -> p1
p1
njmsaplot<-msaplot(p1, df, 
                   offset = 0.02, 
                   width=1, 
                   height = 0.5, 
                   color = c(rep("rosybrown", 1), 
                             rep("sienna1", 1), 
                             rep("lightgoldenrod1", 1), 
                             rep("lightskyblue1", 1),
                             "red"))
image.png

msa這個(gè)包是第一次接觸,還沒有學(xué)會(huì)其中函數(shù)的用法,先知道有這個(gè)功能,等到用到的時(shí)候再來學(xué)習(xí)吧

今天推文的示例數(shù)據(jù)偏大,運(yùn)行時(shí)間可能會(huì)比較長(zhǎng)

歡迎大家關(guān)注我的公眾號(hào)

小明的數(shù)據(jù)分析筆記本

小明的數(shù)據(jù)分析筆記本 公眾號(hào) 主要分享:1、R語言和python做數(shù)據(jù)分析和數(shù)據(jù)可視化的簡(jiǎn)單小例子;2、園藝植物相關(guān)轉(zhuǎn)錄組學(xué)、基因組學(xué)、群體遺傳學(xué)文獻(xiàn)閱讀筆記;3、生物信息學(xué)入門學(xué)習(xí)資料及自己的學(xué)習(xí)筆記!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容