上一篇講了GenVisR 基因組數(shù)據(jù)可視化實戰(zhàn) (一)
是GenVisR畫waterfall 圖對突變類型和豐度的summary圖。今天繼續(xù)測試其他功能

image.png
- lolliplot (mutation hotspot graphic)
準(zhǔn)備數(shù)據(jù):數(shù)據(jù)只需要三列:gene, amino_acid_change, transcript_name

image.png
畫圖代碼:
# Create input data
data <- brcaMAF[brcaMAF$Hugo_Symbol == "TP53", c("Hugo_Symbol", "amino_acid_change_WU")]
data <- as.data.frame(cbind(data, "ENST00000269305"))
colnames(data) <- c("gene", "amino_acid_change", "transcript_name")
# Call lolliplot
lolliplot(data)

image.png
MAF文件中這三列數(shù)據(jù)是已有的,我用TCGA下載的MAF數(shù)據(jù)跟GenVisR官方示例的內(nèi)容有些不一致:
"gene", "transcript_name", "amino_acid_change". 分別對應(yīng)我的MAF文件中:Hugo_Symbol, Protein_Change, Annotation_Transcript,
在TCGA下載的MAF中分別是:Hugo_Symbol, HGVSp_Short, Transcript_ID
所以需要稍微調(diào)整一下內(nèi)容:
library(dplyr)
# 隨便挑選了一個基因“ATAD3B”
data = maf_file %>% select(Hugo_Symbol, HGVSp_Short, Transcript_ID) %>%
subset(Hugo_Symbol == "ATAD3B") %>% filter(!is.na(HGVSp_Short)) %>%
rename(gene = Hugo_Symbol, amino_acid_change = HGVSp_Short, transcript_name=Transcript_ID)
lolliplot(data)

image.png
可能是這個gene(ATAD3B)有問題,換例子中的TP53試試:

image.png
使用自己的數(shù)據(jù):該樣本TP53基因上只有一個突變,故只有一個點:
data = my_maf %>% select(Hugo_Symbol, Protein_Change, Annotation_Transcript) %>%
subset(Hugo_Symbol =="TP53") %>% filter(!is.na(Protein_Change)) %>%
rename(gene = Hugo_Symbol, amino_acid_change = Protein_Change, transcript_name=Annotation_Transcript)
library(stringr)
# 還要將 轉(zhuǎn)錄本id后面的 版本號去掉才行,不然會報錯。
data$transcript_name = str_replace_all(data$transcript_name,".8","")
lolliplot(data)

Image.png