2020.2.2 R語言|Practice2
今日學(xué)習(xí)內(nèi)容一覽
一、Jimmy 生信技能樹B站P7-P10(課上積累)
二、R語言初級練習(xí)題目三道代碼過程
三、Markdown和R Markdown的學(xué)習(xí)網(wǎng)站收藏
-
R語言初級練習(xí)題目三道 代碼過程
-
根據(jù)R包
org.Hs.eg.db找到下面ensembl 基因ID 對應(yīng)的基因名(symbol)-
首先得到gene_id和ensemble_id的關(guān)系矩陣g2e以及gene_id和symbol的關(guān)系矩陣g2s.
library(org.Hs.eg.db) install.packages("org.Hs.eg.db") library(org.Hs.eg.db) g2s=toTable(org.Hs.egSYMBOL) g2e=toTable(org.Hs.egENSEMBL)
g2e.png
-

-
其次繪制出樣本矩陣,并提取小數(shù)點(diǎn)前面的數(shù)字新增一列
a=read.table("尋找基因.txt") library(stringr) library("str_split") str_split(a$V1,'[.]') unlist(str_split(a$V1,'[.]')) class(unlist(str_split(a$V1,'[.]'))) a$ensembl_id=str_split(a$V1,'[.]',simplify = T)[,1]
- 通過共有的ensembl_id建立樣本矩陣與g2e的合并矩陣,再通過合并矩陣與g2s共有的gene_id建立第二個(gè)合并矩陣,最后通過match函數(shù)調(diào)整順序后導(dǎo)出儲(chǔ)存即可。
`b=merge(a,g2e,by='ensembl_id',all.x=T)
d=merge(b,g2s,by='gene_id',all.x=T)
d=d[order(d$V1,)]
d=d[match(a$ensembl_id,d$ensembl_id)]
head(match(a$ensembl_id,d$ensembl_id,))
d=d[match(a$ensembl_id,d$ensembl_id),]
write.csv('d,gene find.csv')`
-
根據(jù)R包
hgu133a.db找到下面探針對應(yīng)的基因名(symbol)-
首先使用read.table函數(shù)讀取樣本文件
rm(list=ls()) options(stringsAsFactors = F) a=read.table('基因ID轉(zhuǎn)換.txt') -
其次使用hgu133plus2.db這個(gè)R包導(dǎo)出probe_id與symbol的對應(yīng)矩陣,最終使用merge函數(shù)合并原樣本矩陣和對應(yīng)矩陣共有的probe_id即可
library(hgu133plus2.db) ids=toTable(hgu133plus2SYMBOL) colnames(ids) colnames(a)='probe_id' d=merge(a,ids,by='probe_id')d.png
-
-
找到R包
CLL內(nèi)置的數(shù)據(jù)集的表達(dá)矩陣?yán)锩娴腡P53基因的表達(dá)量,并且繪制在progres.-stable分組的boxplot圖-
讀取內(nèi)置數(shù)據(jù)庫CLL并查看矩陣,同時(shí)使用pData查看其分組信息
rm(list=ls()) library(CLL) data(sCLLex) expr <- exprs(sCLLex) pdata <- pData(sCLLex) head(expr)
-
-
使用hgu95av2.db這個(gè)R包得到probe_id和symbol的表達(dá)關(guān)系矩陣,再使用grep函數(shù)挑選出其中symbol==TP53的probe_id并建立為一個(gè)新矩陣
library(hgu95av2.db) probe_sym <- toTable(hgu95av2SYMBOL) tp53_probes <- probe_sym[grep("TP53$", probe_sym$symbol),]
-
使用boxplot函數(shù)對三個(gè)相應(yīng)的探針I(yè)D繪圖
boxplot(expr['1939_at',]~pdata$Disease) boxplot(expr['1974_s_at',]~pdata$Disease) boxplot(expr['31618_at',]~pdata$Disease)1939.png


-
最后,使用ggpubr合并圖像,調(diào)整各項(xiàng)參數(shù),改變檢驗(yàn)方法等。
library(ggpubr) tp53_pub <- cbind(expr['1939_at',], as.data.frame(pdata$Disease)) colnames(tp53_pub) <- c('Expression',"Group") p <- ggboxplot(tp53_pub, y='Expression', x='Group',fill = 'Group', palette = 'aaas' ,add = 'jitter')p + stat_compare_means() p + stat_compare_means(method = 't.test')
Rplot.png
-
Markdown和R Markdown的學(xué)習(xí)網(wǎng)站收藏



