D11 2 理解GSVA 單個(gè)基因集的GSVA

先保存,下次有時(shí)間再整理

rm(list = ls())
load(file = 'step2_select.Rdata')
# 每次都要檢測(cè)數(shù)據(jù)
dat<- as.data.frame(t(M_expr))
dat[1:4,1:4]  
library(hgu133plus2.db)
ls("package:hgu133plus2.db")
ids=toTable(hgu133plus2SYMBOL)
head(ids) 
ids$symbol

dat<- dat[rownames(dat)%in%ids$symbol,]

table(rownames(dat) %in% ids$symbol)

ids<- ids[ids$symbol%in%rownames(dat),]
ids<- ids[!duplicated(ids$symbol),]

ids$median=apply(dat,1,median)
# 
#   ids=ids[order(ids$symbol,ids$median,decreasing = T),]
#   ids=ids[!duplicated(ids$symbol),]
# dat=dat[ids$symbol,]
# rownames(dat)=ids$symbol
# dat[1:4,1:4]  
Kmeans_results$group_list[Kmeans_results$`km.res$cluster`==1]<- c('cluster1')
Kmeans_results$group_list[Kmeans_results$`km.res$cluster`==2]<- c('cluster2')
group_list<- Kmeans_results$group_list
X=dat
##############################################################################################
X<- as.matrix(X)

library(GSVA)



options(stringsAsFactors = F)
gene_Set <- read.delim("C:/Users/chenyuqiao/Desktop/LN RNAseq/Step GSVA/395gene GeneSet.txt", header=FALSE, row.names=1)
gene_Set<- as.data.frame(t(gene_Set))
gene_list<- as.list(gene_Set)

es.max <- gsva(X, gene_list, mx.diff=FALSE, verbose=FALSE, parallel.sz=1)






adjPvalueCutoff <- 0.05  #################這里要調(diào)整
logFCcutoff <- log2(2)

  table(group_list)
  dim(es.max)
  design <- model.matrix(~0+factor(group_list))
  colnames(design)=levels(factor(group_list))
  rownames(design)=colnames(es.max)
  design
  library(limma)
  contrast.matrix<-makeContrasts(paste0(unique(group_list),collapse = "-"),
                                 levels = design)
  # contrast.matrix<-makeContrasts("TNBC-noTNBC",
  #                                levels = design)
  
  contrast.matrix ##這個(gè)矩陣聲明,我們要把progres.組跟stable進(jìn)行差異分析比較
  
 
    ##step1
    fit <- lmFit(es.max,design)
    ##step2
    fit2 <- contrasts.fit(fit, contrast.matrix) 
    ##這一步很重要,大家可以自行看看效果
    
    fit2 <- eBayes(fit2)  ## default no trend !!!
    ##eBayes() with trend=TRUE
    ##step3
    res <- decideTests(fit2, p.value=adjPvalueCutoff)
    summary(res)
    tempOutput = topTable(fit2, coef=1, n=Inf)
    nrDEG = na.omit(tempOutput) 
    #write.csv(nrDEG2,"limma_notrend.results.csv",quote = F)
    head(nrDEG)
    
    data_gene_set<- as.data.frame(es.max)
    

    nrDEG=nrDEG[nrDEG$P.Value<0.5 & abs(nrDEG$logFC) > 0.1,]   #######在這里調(diào)閾值,保證輸出
    print(dim(nrDEG))

      n=rownames(nrDEG)
      match(n,rownames(nrDEG))
      data_gene_set=data_gene_set[match(n,rownames(data_gene_set)),]  ######n=rownames(nrDEG),篩選表達(dá)矩陣數(shù)據(jù)
      ac=data.frame(g=group_list)   ########對(duì)應(yīng)后面的圖中的annotation_col
      rownames(ac)=colnames(data_gene_set)
      # rownames(nrDEG)=substring(rownames(nrDEG),1,50)
      library(pheatmap)
      pheatmap(data_gene_set)
      dev.off
      pheatmap(data_gene_set)
      pheatmap::pheatmap(data_gene_set, 
                         fontsize_row = 8,height = 11,
                         annotation_col = ac,show_colnames = F,filename = '11111111111.pdf')
      
      # pheatmap::pheatmap(nrDEG, 
      #                    fontsize_row = 8,height = 11,
      #                    annotation_col = ac,show_colnames = F,
      #                    filename = '11111111111.pdf')
      # 
   
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 正值北方供暖,蒼茫大地被霧霾籠罩,首都機(jī)場(chǎng)一片混亂,包頭霧霾爆表,行走于賽罕塔拉,思緒所致,寫(xiě)下此文。 畢業(yè)已有四...
    小橋流水非人家閱讀 887評(píng)論 0 0
  • ◆ 一、紅燒土豆 食材: 土豆500g,油適量,大料2個(gè),生抽25ml,老抽10ml,耗油10ml,鹽少許,白糖3...
    味博士閱讀 647評(píng)論 0 5
  • 夢(mèng)想在沙灘上長(zhǎng)出了翅膀古老的記憶銘刻昨日的荒涼征途是如此遙遠(yuǎn)遙遠(yuǎn)又漫長(zhǎng)世界的單調(diào)組合地獄和天堂 英雄手中緊握的寶劍...
    信陵脫劍閱讀 161評(píng)論 0 1
  • 這次游學(xué)的意義非凡。志不立,天下無(wú)可成之事!圣人之道,悟性自足! 在前半生,都是過(guò)著一種平平淡淡,知足常樂(lè)的市井生...
    別來(lái)無(wú)恙朱梅閱讀 280評(píng)論 1 8

友情鏈接更多精彩內(nèi)容