數(shù)據(jù)結(jié)構(gòu)

一、新手必備重點知識（來源：微信公眾號生信星球）

（1）R的賦值符號不是等號，而是<-

（2）在Console 控制臺輸入命令，相當于Linux的命令行

（3）R的代碼都是帶括號的，括號必須是英文的。

（4）顯示工作路徑 getwd()

（5）向量是由元素組成的，元素可以是數(shù)字或者字符串。

（6）表格在R語言中改名叫數(shù)據(jù)框^_

（7）別只復制代碼，要理解其中的命令、函數(shù)的意思。函數(shù)或者命令不會用時，除了百度/谷歌搜索以外，用這個命令查看幫助：

?read.table
調(diào)出對應的幫助文檔，翻到example部分研究一下。

（8）數(shù)據(jù)類型（重點只有兩個，剩下的不看）

向量（vector）??重要

矩陣（Matrix）

數(shù)組（Array）

數(shù)據(jù)框（Data frame）??重要

List

part1：向量

二、標量和向量的區(qū)分

變量包含標量和向量

1、元素指的是數(shù)字或者字符串（用chr表示）等

標量：一個元素組成的變量；

向量：多個元素有序排列組成的變量，一個向量可以作為數(shù)據(jù)框中的一列。

2、使用前要給變量賦值

如：x<- c(1,2,3) #常用的向量寫法，意為將x定義為由元素1，2，3組成的向量。

Tips：

1、重復賦值會覆蓋上一次賦值，x的定義以最后一次賦值為準，此時x為1 2 3 1 2 3

2、變量名可以為別的字母

三、從向量中提取元素

1、根據(jù)值來提取

x[4] #x第4個元素
x[-4]#排除法，除了第4個元素之外剩余的元素
x[2:4]#第2到4個元素
x[-(2:4)]#除了第2-4個元素
x[c(1,5)] #第1個和第5個元素

1、根據(jù)位置來提取

x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c（1，2，5）中的元素

截屏2021-11-20 上午8.48.05.png

Part2：數(shù)據(jù)框

將示例數(shù)據(jù)放在工作目錄下

一、讀取本地數(shù)據(jù)

1、

讀取并將數(shù)據(jù)賦值給a

用幫助文檔查看sep和header的意思

sep：數(shù)據(jù)的分隔符，

header：預示著文件是否包含變量名稱作為第一行的邏輯值

幫助文檔

二、設置行名和列名

X<-read.csv('doudou.txt') #在示例數(shù)據(jù)里有doudou.txt 注意這里的變量X是一個數(shù)據(jù)框
colnames(X) #查看列名
rownames(X) #查看行名,默認值的行名就是行號，1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回數(shù)據(jù)，左上角第一格為空，R會自動補為x,用這個命令來修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列為行名

注意嚴格區(qū)分字母大小寫

三、數(shù)據(jù)框的導出

write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改為逗號，字符串不加雙引號（默認格式帶由雙引號）

已導出數(shù)據(jù)框

四、變量的保存與重新加載

這次沒有處理完的數(shù)據(jù)可以保存和重新加載。保存的格式是RData。

save.image(file="bioinfoplanet.RData")#保存當前所有變量
save(X,file="test.RData")#保存其中一個變量
load("test.RData")#再次使用RData時的加載命令

工作目錄下保存的數(shù)據(jù)

五、提取元素（來源：微信公眾號生信星球）

X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列
X[y] #也是第y列
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列（這個命令不用寫括號的地步，并且支持Tab自動補全哦，不過只能提取一列）

六、直接使用數(shù)據(jù)框中的變量

plot(iris$Sepal.Length,iris$Sepal.Width)

散點圖

保存到工作目錄下

七、save(X,file="test.RData")這句代碼如果報錯object X not found

原因可能是文件的路徑錯了，路徑應該放在工作目錄下

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

學習小組Day5筆記-云朵

數(shù)據(jù)結(jié)構(gòu)

一、新手必備重點知識（來源：微信公眾號 生信星球）

（1）R的賦值符號不是等號，而是<-

（2）在Console 控制臺輸入命令，相當于Linux的命令行

（3）R的代碼都是帶括號的，括號必須是英文的。

（4）顯示工作路徑 getwd()

（5）向量是由元素組成的，元素可以是數(shù)字或者字符串。

（6）表格在R語言中改名叫數(shù)據(jù)框_

（7）別只復制代碼，要理解其中的命令、函數(shù)的意思。函數(shù)或者命令不會用時，除了百度/谷歌搜索以外，用這個命令查看幫助：

（8）數(shù)據(jù)類型（重點只有兩個，剩下的不看）

part1：向量

二、標量和向量的區(qū)分

變量包含標量和向量

1、元素指的是數(shù)字或者字符串（用chr表示）等

標量：一個元素組成的變量；

向量：多個元素有序排列組成的變量，一個向量可以作為數(shù)據(jù)框中的一列。

2、使用前要給變量賦值

如：x<- c(1,2,3) #常用的向量寫法，意為將x定義為由元素1，2，3組成的向量。