數(shù)據(jù)結(jié)構(gòu)學(xué)習(xí)
- R的賦值符號不是等號,而是<-
- 在Console控制臺輸入命令,相當(dāng)于Linux的命令行
- R的代碼都是帶括號的,括號必須是英文的
- 顯示工作路徑是getwd()
- 向量是由元素組成的,元素可以是數(shù)字或者字符串
- 表格在R語言中改名叫數(shù)據(jù)框
- 不要只復(fù)制代碼,要理解其中的命令,函數(shù)的意思。函數(shù)或者命令不會用時,可以用
?read.table,調(diào)出對應(yīng)的幫助文檔,翻到example部分研究一下 - 數(shù)據(jù)類型(重點只有兩個)
- 向量(vector)——重要
- 矩陣(Matrix)
- 數(shù)組(Array)
- 數(shù)據(jù)框(Data frame)——重要
- List
最重要是熟悉向量和數(shù)據(jù)框
part1 向量
1. 向量與標(biāo)量的區(qū)別
首先明確元素的意思,元素指的是數(shù)字或者字符串(用chr表示)等,根據(jù)它可以區(qū)分兩個詞:
標(biāo)量:一個元素組成的變量
向量:多個元素組成的變量
(補充:一個向量是一排有序排列的元素,以后會用到把一個向量作為數(shù)據(jù)框中的一列的情況)
使用時,一般會直接給變量定義,也就是賦值,就是賦予這個變量一個數(shù)值。(不一定是數(shù)值,還可以是字符串/數(shù)據(jù)框等等)
x<- c(1,2,3) #常用的向量寫法,意為將x定義為由元素1,2,3組成的向量。
x<- 1:10 #從1-10之間所有的整數(shù)
x<- seq(1,10,by = 0.5) #1-10之間每隔0.5取一個數(shù)(注意是逗號不是分號)
x<- rep(1:3,times=2) #1-3 重復(fù)2次
注:如果把這幾行代碼都打過了,那么x就被賦值了4次,后面一次的會把前面一次的覆蓋掉,以最后一次為準(zhǔn)。
2. 從向量中提取元素
(1)根據(jù)元素的位置
#這里的x是你剛才賦值的變量名,根據(jù)自己的情況來修改
x[4] #x第4個元素
x[-4]#排除法,除了第4個元素之外剩余的元素
x[2:4]#第2到4個元素
x[-(2:4)]#除了第2-4個元素
x[c(1,5)] #第1個和第5個元素
(2)根據(jù)值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素