今天開始學習R語言中的數(shù)據(jù)結構,內(nèi)容如下:
向量及相關操作
定義
向量:多個元素(數(shù)字或者字符串)組成的變量。有時候也需要將向量或一串字符或數(shù)據(jù)框進行賦值
比如如下代碼
x<- c(1,2,3) #常用的向量寫法,意為將x定義為由元素1,2,3組成的向量。
x<- 1:10 #從1-10之間所有的整數(shù)
x<- seq(1,10,by = 0.5) #1-10之間每隔0.5取一個數(shù)(注意是逗號不是分號)
x<- rep(1:3,times=2) #1~3 重復2次
從向量中提取元素
根據(jù)元素位置
例如
x[3] #第3個元素
x[-3] #排除法,除了第3個元素之外剩余的元素
x[5:8] #第5到8個元素
x[-(5:8)] #除了第5-8個元素
x[c(2,3)] #第2個和第3個元素
根據(jù)具體的值
例如如下代碼
x[x==10] #等于10的元素
x[x<4] #<4的元素
x[x %in% c(1,4,6)] #存在于向量c(1,4,6)中的元素
數(shù)據(jù)框
數(shù)據(jù)框即我們通常所說的表格
讀取數(shù)據(jù)
讀取數(shù)據(jù)前首先要設置工作目錄
setwd("C:\\Users\\fxiao\\Desktop\\生信學習小組")
read.table(file ="huahua.txt",sep="\t",header =T)
a<-read.table(file ="huahua.txt", sep ="\t", header =T)
設置行名和列名
X<-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個數(shù)據(jù)框
colnames(X) #查看列名
rownames(X) #查看行名,默認值的行名就是行號,1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回數(shù)據(jù),左上角第一格為空,R會自動補為x,用這個命令來修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列為行名
數(shù)據(jù)框的導出
write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改為逗號,字符串不加雙引號(默認格式帶由雙引號
變量的保存與重新加載
save.image(file="bioinfoplanet.RData")#保存當前所有變量
save(X,file="test.RData")#保存其中一個變量
load("test.RData")#再次使用RData時的加載命令
提取元素
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(優(yōu)秀寫法,而且這個命令還優(yōu)秀到不用寫括號的地步,并且支持Tab自動補全哦,不過只能提取一列)
題:save(X,file="test.RData")這句代碼如果報錯object X not found,是為什么,應該怎么解決?
答:這里提示沒有找到X,說明X沒有被賦值,區(qū)分前面代碼中的大小寫,給X重新賦值后再保存 。