GATK后maftools可視化

#####刪除文件的前N行####

tail -n +N Het-158-rawGATK-indel-filter.vcf| head

#####合并所有VCF文件####(合并之后記得加上第一行)

for i in *.vcf ; do sed -i '1d' $i ; done

for i in *.vcf ; do cat $i >> 11.vcf; done

#####利用annovar轉(zhuǎn)換格式#####

for i in *.vcf ; do perl /media/pc/disk2/annovar/convert2annovar.pl -format vcf4 $i > $i.avinput

#####添加樣本名稱#####(先把snp和indel文件合并會(huì)省事一點(diǎn))

awk 'BEGIN{OFS="\t"}{print "chr"$1,$2,$3,$4,$5,"Het-158"}' Het-158-indel.vcf.avinput> Het-158-indel.tsv

#####合并所有tsv#####

for i in *.tsv ; do cat $i >> all.tsv; done

#####利用annovar注釋####

perl /media/pc/disk2/annovar/table_annovar.pl all.tsv/media/pc/disk2/annovar/mousedb/ -buildver mm10 -out variants --otherinfo -remove -protocol refGene -operation g -nastring NA

####可選步驟:提取exonic上的信息#####

grep "exonic" variants.mm10_multianno.txt> exonic.mm10_multianno.txt

####Rstudio:導(dǎo)入到maftools###

>library(maftools)

>var.annovar.maf = annovarToMaf(annovar = "variants.mm10_multianno.txt",Center = 'CSI-NUS', refBuild = 'mm10',tsbCol = 'Tumor_Sample_Barcode', table = 'refGene')

>write.table(x=var.annovar.maf,file="var_annovar_maf",quote= F,sep="\t",row.names=F)

>var_maf = read.maf(maf="var_annovar_maf")

>plotmafSummary(maf = var_maf, rmOutlier = TRUE, addStat = 'median',showBarcodes = T)

>oncoplot(maf = var_maf, top = 10, fontSize = 12)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容