數(shù)據(jù)結(jié)構(gòu)
一、新手必備重點知識(來源:微信公眾號 生信星球)
(1)R的賦值符號不是等號,而是<-
(2)在Console 控制臺輸入命令,相當于Linux的命令行
(3)R的代碼都是帶括號的,括號必須是英文的。
(4)顯示工作路徑 getwd()
(5)向量是由元素組成的,元素可以是數(shù)字或者字符串。
(6)表格在R語言中改名叫數(shù)據(jù)框_
(7)別只復制代碼,要理解其中的命令、函數(shù)的意思。函數(shù)或者命令不會用時,除了百度/谷歌搜索以外,用這個命令查看幫助:
?read.table
調(diào)出對應的幫助文檔,翻到example部分研究一下。
(8)數(shù)據(jù)類型(重點只有兩個,剩下的不看)
向量(vector)??重要
矩陣(Matrix)
數(shù)組(Array)
數(shù)據(jù)框(Data frame)??重要
List
part1:向量
二、標量和向量的區(qū)分
變量包含標量和向量
1、元素指的是數(shù)字或者字符串(用chr表示)等
標量:一個元素組成的變量;
向量:多個元素有序排列組成的變量,一個向量可以作為數(shù)據(jù)框中的一列。
2、使用前要給變量賦值
如:x<- c(1,2,3) #常用的向量寫法,意為將x定義為由元素1,2,3組成的向量。

Tips:
1、重復賦值會覆蓋上一次賦值,x的定義以最后一次賦值為準,此時x為1 2 3 1 2 3
2、變量名可以為別的字母
三、從向量中提取元素
1、根據(jù)值來提取
x[4] #x第4個元素
x[-4]#排除法,除了第4個元素之外剩余的元素
x[2:4]#第2到4個元素
x[-(2:4)]#除了第2-4個元素
x[c(1,5)] #第1個和第5個元素

1、根據(jù)位置來提取
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素

截屏2021-11-20 上午8.48.05.png
Part2:數(shù)據(jù)框

將示例數(shù)據(jù)放在工作目錄下
一、讀取本地數(shù)據(jù)
1、
讀取并將數(shù)據(jù)賦值給a

讀取并將數(shù)據(jù)賦值給a
用幫助文檔查看sep和header的意思
sep:數(shù)據(jù)的分隔符,
header:預示著文件是否包含變量名稱作為第一行的邏輯值

幫助文檔
二、設置行名和列名
X<-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個數(shù)據(jù)框
colnames(X) #查看列名
rownames(X) #查看行名,默認值的行名就是行號,1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回數(shù)據(jù),左上角第一格為空,R會自動補為x,用這個命令來修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列為行名

注意嚴格區(qū)分字母大小寫
三、數(shù)據(jù)框的導出
write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改為逗號,字符串不加雙引號(默認格式帶由雙引號)

已導出數(shù)據(jù)框
四、變量的保存與重新加載
這次沒有處理完的數(shù)據(jù)可以保存和重新加載。保存的格式是RData。
save.image(file="bioinfoplanet.RData")#保存當前所有變量
save(X,file="test.RData")#保存其中一個變量
load("test.RData")#再次使用RData時的加載命令

工作目錄下保存的數(shù)據(jù)
五、提取元素(來源:微信公眾號 生信星球)
- X[x,y]#第x行第y列
- X[x,]#第x行
- X[,y]#第y列
- X[y] #也是第y列
- X[a:b]#第a列到第b列
- X[c(a,b)]#第a列和第b列
- X$列名#也可以提取列(這個命令不用寫括號的地步,并且支持Tab自動補全哦,不過只能提取一列)
六、直接使用數(shù)據(jù)框中的變量
plot(iris$Sepal.Length,iris$Sepal.Width)

散點圖

保存到工作目錄下
七、save(X,file="test.RData")這句代碼如果報錯object X not found
原因可能是文件的路徑錯了,路徑應該放在工作目錄下