R語(yǔ)言中的數(shù)據(jù)結(jié)構(gòu)
小知識(shí)
- r賦值 為
<-快捷鍵為alt + - 顯示工作路徑
getwd() - 表格在 r 中稱為數(shù)據(jù)框
- 函數(shù)、命令不懂時(shí)可以百度,或
?read.table查看幫助文檔 - 數(shù)據(jù)類型:向量(vector),數(shù)據(jù)框(data frame),矩陣(matrix),數(shù)組(array),list
思維導(dǎo)圖.jpg
向量
-
元素 向量 標(biāo)量
元素:數(shù)字或字符串 chr
標(biāo)量:一個(gè)元素組成的變量
向量:多個(gè)元素組成的變量
x<- c(1,2,3) #常用的向量寫(xiě)法,意為將x定義為由元素1,2,3組成的向量。
x
x<- 1:10 #從1-10之間所有的整數(shù)
x
x<- seq(1,10,by = 0.5) #1-10之間每隔0.5取一個(gè)數(shù)(注意是逗號(hào)不是分號(hào))
x
x<- rep(1:3,times=2) #1-3 重復(fù)2次
x
- 提取向量中元素
(1)根據(jù)位置
x[4] #x第4個(gè)元素
x[-4]#排除法,除了第4個(gè)元素之外剩余的元素
x[2:4]#第2到4個(gè)元素
x[-(2:4)]#除了第2-4個(gè)元素
x[c(1,5)] #第1個(gè)和第5個(gè)元素
(2)根據(jù)數(shù)值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
數(shù)據(jù)框
- 讀取本地?cái)?shù)據(jù)
read.table(file = "huahua.txt",sep = "\t",header=T)
sep:字符分割
header:true則excel第一行用于列名稱,具體數(shù)據(jù)從第二行開(kāi)始;false則第一行即為具體數(shù)據(jù)
- 設(shè)置行名和列名
X<-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個(gè)數(shù)據(jù)框
colnames(X) #查看列名
rownames(X) #查看行名,默認(rèn)值的行名就是行號(hào),1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回?cái)?shù)據(jù),左上角第一格為空,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來(lái)修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列為行名
csv和table均為數(shù)據(jù)框的儲(chǔ)存形式,以csv提取具有更好的包容性和通融性。
- 數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F)#數(shù)據(jù)框?qū)С鰹槲募皔u.txt”,分隔符改為逗號(hào),字符串不加雙引號(hào)(默認(rèn)格式帶由雙引號(hào))
quote:字符串是否使用引號(hào)表示,默認(rèn)為T(mén)RUE
- 變量保存和重新加載
save.image(file="bioinfoplanet.RData")#保存當(dāng)前所有變量
save(X,file="test.RData")#保存其中一個(gè)變量
load("test.RData")#再次使用RData時(shí)的加載命令
- 提取元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(優(yōu)秀寫(xiě)法,而且這個(gè)命令還優(yōu)秀到不用寫(xiě)括號(hào)的地步,并且支持Tab自動(dòng)補(bǔ)全哦,不過(guò)只能提取一列)
問(wèn)題回答
save(X,file="test.RData")報(bào)錯(cuò)的原因是,變量賦值是有可能付給了小寫(xiě)的x,而在保存時(shí)則找不到大寫(xiě)的X變量。
