GenVisR 基因組數(shù)據(jù)可視化實戰(zhàn)(二)

上一篇講了GenVisR 基因組數(shù)據(jù)可視化實戰(zhàn) (一)
是GenVisR畫waterfall 圖對突變類型和豐度的summary圖。今天繼續(xù)測試其他功能

image.png

  1. lolliplot (mutation hotspot graphic)

準(zhǔn)備數(shù)據(jù):數(shù)據(jù)只需要三列:gene, amino_acid_change, transcript_name

image.png

畫圖代碼:

# Create input data
data <- brcaMAF[brcaMAF$Hugo_Symbol == "TP53", c("Hugo_Symbol", "amino_acid_change_WU")]
data <- as.data.frame(cbind(data, "ENST00000269305"))
colnames(data) <- c("gene", "amino_acid_change", "transcript_name")

# Call lolliplot
lolliplot(data)
image.png

MAF文件中這三列數(shù)據(jù)是已有的,我用TCGA下載的MAF數(shù)據(jù)跟GenVisR官方示例的內(nèi)容有些不一致:

"gene", "transcript_name", "amino_acid_change". 分別對應(yīng)我的MAF文件中:Hugo_Symbol, Protein_Change, Annotation_Transcript,

在TCGA下載的MAF中分別是:Hugo_Symbol, HGVSp_Short, Transcript_ID
所以需要稍微調(diào)整一下內(nèi)容:

library(dplyr)
# 隨便挑選了一個基因“ATAD3B”
data = maf_file %>% select(Hugo_Symbol, HGVSp_Short, Transcript_ID) %>%
  subset(Hugo_Symbol == "ATAD3B") %>% filter(!is.na(HGVSp_Short)) %>%
  rename(gene = Hugo_Symbol, amino_acid_change = HGVSp_Short, transcript_name=Transcript_ID)

lolliplot(data)
image.png

可能是這個gene(ATAD3B)有問題,換例子中的TP53試試:

image.png

使用自己的數(shù)據(jù):該樣本TP53基因上只有一個突變,故只有一個點:

data = my_maf %>% select(Hugo_Symbol, Protein_Change, Annotation_Transcript) %>%
  subset(Hugo_Symbol =="TP53") %>% filter(!is.na(Protein_Change)) %>%
  rename(gene = Hugo_Symbol, amino_acid_change = Protein_Change, transcript_name=Annotation_Transcript)

library(stringr)

# 還要將 轉(zhuǎn)錄本id后面的 版本號去掉才行,不然會報錯。
data$transcript_name = str_replace_all(data$transcript_name,".8","")

lolliplot(data)
Image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容