利用R語言將新版TCGA突變數(shù)據(jù)整理成0-1矩陣

1. 下載所需樣本的maf文件

網(wǎng)址:https://portal.gdc.cancer.gov/
simple nucleotide varaition→masked somatic mutation→感興趣的癌種→cart下載

2. 整理成一個maf文件

參考:http://www.itdecent.cn/p/718fd6d34696

3. 將maf文件轉(zhuǎn)換成0-1突變矩陣
maf <- maf[maf$Variant_Classification != "Silent", ]   # Filter silent mutation
mut <- pmin(table(maf$Hugo_Symbol, maf$Tumor_Sample_Barcode), 1)
mut <- as.data.frame(mut)
mut <- dcast(mut, formula = Var1 ~ Var2)
rownames(mut) <- mut$Var1; mut <- dplyr::select(mut, -Var1)
# mut[1:5,1:5]

完成。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容