學(xué)習(xí)內(nèi)容--R語(yǔ)言數(shù)據(jù)結(jié)構(gòu)
數(shù)據(jù)類(lèi)型(重點(diǎn)掌握向量、數(shù)據(jù)框)
向量(vector)
矩陣(Matrix)
數(shù)組(Array)
數(shù)據(jù)框(Data frame)
List
1. 向量
元素:數(shù)字或者字符串
標(biāo)量:一個(gè)元素組成的變量
向量:多個(gè)元素組成的變量

來(lái)自生信星球
給變量賦值(可以是字符,也可以是數(shù)據(jù)框)

從向量中提取元素
根據(jù)元素的位置

根據(jù)值

2. 數(shù)據(jù)框
新建doudou.txt,輸入以下

image.png
用命令X<-read.csv('doudou.txt')即可獲得示例數(shù)據(jù)框

注:將示例數(shù)據(jù)一定要放在你的工作目錄下,不然會(huì)報(bào)錯(cuò),會(huì)出現(xiàn)找不到(X not found )
(1)讀取本地?cái)?shù)據(jù)及對(duì)變量賦值
讀取:read.table(file = "huahua.txt", sep = "\t", header = T)
注:“huahua.txt”,空格seq…… ,不然會(huì)報(bào)錯(cuò)
論這個(gè)空格的重要性(血淋淋的現(xiàn)實(shí))

"sep"間隔符,"header"首行如果不是空的即首行做表頭
賦值:a<-read.table(file = "huahua.txt", sep = "\t", header = T)
(2)設(shè)置行名和列名
colnames(x)—查看列名
rownames(x)—查看行名,默認(rèn)值的行名就是行號(hào),1/2/3/4...
x<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)—最后row.names的意思是修改第一列為行名
(3)數(shù)據(jù)框的導(dǎo)出
write.table(x,file = "yu.txt",sep = ",",quote=F)—分隔符改為逗號(hào),字符串不加雙引號(hào)(默認(rèn)格式帶由雙引號(hào)),變量x數(shù)據(jù)框?qū)С鰹閥u.txt文件


(4)變量的保存與重新加載
save.image(file="bioinfoplanet.RData")—保存當(dāng)前所有變量
save(X,file="test.RData")—保存其中一個(gè)變量
load("test.RData")—再次使用RData時(shí)的加載命令
(5)提取元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(優(yōu)秀寫(xiě)法,而且這個(gè)命令還優(yōu)秀到不用寫(xiě)括號(hào)的地步,并且支持Tab自動(dòng)補(bǔ)全哦,不過(guò)只能提取一列)
引自:生信星球

(6)直接使用數(shù)據(jù)框中的變量
輸入 a <-data.frame(case=paste("S",1:50),values=runif(50))
再輸入 plot(a)

更高效的方法
方法1:attach
輸入attach(a)
再輸入plot(case,values)
做完后將a刪除出搜索環(huán)境 detach(a)
局限性:兩個(gè)以上數(shù)據(jù)框的列名有沖突時(shí),同時(shí)attach會(huì)報(bào)錯(cuò)。
方法2:with
with就是把所有操作都限制在數(shù)據(jù)框上
with(a,{
plot(case,values)
x<<-summary(values) #求和并賦值給x,<<的意思是作為全局變量,也就是出了大括號(hào)仍有效。
})
x #運(yùn)行完后打印x
引自:生信星球
最后附一張思維導(dǎo)圖

R語(yǔ)言數(shù)據(jù)結(jié)構(gòu).png