R語言基本知識
- 向量是由元素組成的,元素可以是數(shù)字或者字符串
- 表格在R語言中改名叫作數(shù)據(jù)框
- 函數(shù)或者命令不會(huì)用時(shí),可以使用查看幫助,調(diào)出對應(yīng)文檔,翻到example部分進(jìn)行研究
?read.table - 數(shù)據(jù)類型
向量(vector)(重要)
數(shù)據(jù)框(data frame)(重要)
矩陣(matrix)
數(shù)組(array)
list
向量(下列代碼中x為變量名)
- 向量與標(biāo)量
標(biāo)量:一個(gè)元素組成的變量(例如:1,"huahua")
向量:多個(gè)元素有序排列組成的變量(例如:c(1,2,3), c("doudou","huahua","yu"))
賦值代碼(相同變量x,后一次的賦值能夠覆蓋前一次的賦值)
x<-c(1,2,3)
x<-(1:10)
#從1-10之間所有的整數(shù)
x<-seq(1,10,by = 0.5)
#1-10之間每隔0.5取一個(gè)數(shù)
x<-rep(1:3,times=2)
#1-3 重復(fù)2次
- 從向量中提取元素
(1)根據(jù)元素的位置提取元素(里面是中括號)
x[4]
#提取第4個(gè)元素
x[-4]
#排除法,提取除了第4個(gè)元素之外剩余的元素
x[2:4]
#提取第2到4個(gè)元素
x[-(2:4)]
#提取除了第2到4個(gè)元素以外的元素
x[c(1,5)]
#提取第1個(gè)和第5個(gè)元素
數(shù)據(jù)框(將數(shù)據(jù)放在工作目錄)(下列代碼中x為變量名)
- 讀取本地?cái)?shù)據(jù)
read.table(file = "huahua.txt",sep = "\t",header =T)
#讀取文件,分隔符為Tab,有表頭
a<-read.table(file = "huahua.txt",sep = "\t",header =T)
#把這個(gè)數(shù)據(jù)框賦給一個(gè)變量a
- 設(shè)置行名和列名
X<-read.csv('doudou.txt')
colnames(X)
#查看列名
rownames(X)
#查看行名,默認(rèn)值的行名就是行號,1.2.3.4...
colnames(X)[1]<-"bioplanet"
#有的公司返回?cái)?shù)據(jù),左上角第一格為空,R會(huì)自動(dòng)補(bǔ)為x,用這個(gè)命令來修改
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1)
#最后row.names的意思是修改第一列為行名
- 數(shù)據(jù)框的導(dǎo)出
write.table(X,file = "yu.txt",sep = ",",quote=F)
#分隔符改為逗號,字符串不加雙引號(默認(rèn)格式帶由雙引號)
- 變量的保存與重新加載
save.image(file="bioinfoplanet.RData")
#保存當(dāng)前所有變量
save(frame1,file="frame1.RData")
#保存其中一個(gè)變量
load("frame1.RData")
#再次使用RData時(shí)的加載命令
- 提取元素
X[x,y]
#第x行第y列
- X[x,]
#第x行
- X[,y]
#第y列(橫著寫,這是不夠懶也不夠優(yōu)秀卻能存在的寫法)
- X[y]
#第y列(豎著寫,這是懶惰又優(yōu)秀的寫法)
- X[a:b]
#第a列到第b列
- X[c(a,b)]
#第a列和第b列
- X$列名
#也可以提取列(優(yōu)秀寫法,而且這個(gè)命令還優(yōu)秀到不用寫括號的地步,并且支持Tab自動(dòng)補(bǔ)全哦,不過只能提取一列)