From 生信技能樹
-視頻回放:R語言-向量練習(xí)和數(shù)據(jù)結(jié)構(gòu)入門
-proj:R_01.Rproj
-課件:R_01.pdf
-課時長:88'28''前半部分
-主講人:小潔忘了怎么分身
2.1 向量的生成
(1)用c()逐一放到一起(手串兒得有穿的繩兒)
(2)連續(xù)的數(shù)字用冒號”:”
(3)有重復(fù)的用rep(),有規(guī)律的序列用seq(),隨機數(shù)用rnorm
rnorm(n = 3, mean = 0, sd = 1) 等同于rnorm(n = 3)
sd越大,曲線越扁
(4)通過組合,產(chǎn)生更為復(fù)雜的向量。
paste0把下標相同的元素連接在一起
paste和paste0的去區(qū)別:
http://www.itdecent.cn/p/44e3de9b7a81
tips:數(shù)據(jù)類型轉(zhuǎn)換的優(yōu)先順序
字符型 to 數(shù)值型 to邏輯型
2.2 對單個向量進行的操作
重點是函數(shù)
max(x) #最大值min(x) #最小值mean(x) #均值median(x) #中位數(shù)var(x) #方差sd(x) #標準差sum(x) #總和
> x <-c(1,3,5,1)
> length(x) #長度
[1] 4
> unique(x) #去掉重復(fù)的向量元素
[1] 1 3 5
> duplicated(x)#判斷向量的元素是否發(fā)生了重復(fù),重復(fù)根據(jù)位置來判斷,即一個向量的元素第一次出現(xiàn)就是FALSE,第二次出現(xiàn)就是TRUE
[1] FALSE FALSE FALSE TRUE
> table(x) #統(tǒng)計重復(fù)值
x
1 3 5
2 1 1
> sort(x) #默認decreasing = FALSE,從小到大排列
[1] 1 1 3 5
2.3.對兩個向量的操作
邏輯比較
x和y一樣長
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> x == y
[1] FALSE FALSE TRUE FALSE
x和y不一樣長 ,理解循環(huán)補齊,短的循環(huán)補齊長的
> x = c(1,3,5)
> y = c(3,2,5,6)
> x == y #判斷x和對應(yīng)位置的y是否相等;x, y長度不相同的情況下以長的為準,和誰在前誰在后沒有關(guān)系;
[1] FALSE FALSE TRUE FALSE
Warning message:
In x == y : longer object length is not a multiple of shorter object length
x和y一樣長
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> x %in% y #判斷x的每個元素在y中是否存在,和前后有關(guān)系
[1] FALSE TRUE TRUE FALSE
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> x[x %in% y] #正確格式
[1] 3 5
> y[x %in% y] #或者x[y %in% x]雖然不會報錯,但是沒有意義
[1] 2 5
> y[y %in% x] #正確格式
[1] 3 5
x和y不一樣長,長度和x一樣
> x = c(1,3,5)
> y = c(3,2,5,6)
> x[x %in% y]
[1] 3 5
數(shù)學(xué)計算
x和y一樣長
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> x + y #對應(yīng)下標的加減乘除
[1] 4 5 10 7
x和y不一樣長
> x = c(1,3,5)
> y = c(3,2,5,6)
> x + y #不對應(yīng)時,從短的循環(huán)補齊長的進行計算
[1] 4 5 10 7
Warning message:
In x + y : longer object length is not a multiple of shorter object length
連接
x和y一樣長
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> paste(x,y, sep = ",")
[1] "1,3" "3,2" "5,5" "1,6"
x和y不一樣長
> x = c(1,3,5)
> y = c(3,2,5,6)
> paste(x,y, sep = ",")
[1] "1,3" "3,2" "5,5" "1,6"
交并補集
2.4.向量篩選(取子集)[ ]:
根據(jù)邏輯值,【這里是與x等長的邏輯值向量】將TRUE對應(yīng)的向量挑選出來,F(xiàn)ALSE丟棄
> x <-8:12
> x[x == 10]
[1] 10
> x[x < 12]
[1] 8 9 10 11
> x[x %in% c(9,13)]
[1] 9
x[!duplicated(x)] # == unique(x)
x[order(x)] # == sort(x)
根據(jù)位置,【這里是下標組成的向量】將下標組成的向量挑選出來
> x <-8:12
> x[4]
[1] 11
> x[2:4]
[1] 9 10 11
> x[c(1,5)]
[1] 8 12
> x[1,5] # 不能沒有c(),否則會報錯
Error in x[1, 5] : incorrect number of dimensions
> x[-4]
[1] 8 9 10 12
> x[-(2:4)]
[1] 8 12
踩坑操作
> z = rnorm(n=10,mean=0,sd=18)
> z[z< -2] # <-和< -容易踩坑
[1] -13.732056 -3.771442 -9.637322 -13.815601 -3.189252
> z[z<(-2)] #所以要加括號或者有空格
[1] -13.732056 -3.771442 -9.637322 -13.815601 -3.189252
> z[z<-2]
[1] -2.863705
> z[z<(-33)] #沒有我要的<-33的數(shù),所以返回的是一個長度為0的數(shù)值型向量
numeric(0)
2.5 如何修改向量中的某個/某些元素?即取子集和賦值的集合
多次賦值以最后一次為準
2.6 簡單向量作圖
boxplot什么意思?怎么看?
向量匹配排序-match(x,y):x在y中的向量下標
> x <-c("A","B","C","D","E")
> y <-c("B","D","E","A","C")
> match(y,x)
[1] 2 4 5 1 3
> x[match(y,x)] # 以y作為模板,給x調(diào)順序;誰在外面,誰就在后面
[1] "B" "D" "E" "A" "C"
> x=letters[1:5]
> x
[1] "a" "b" "c" "d" "e"
> y=letters[c(3,1,2,5,4)]
> y
[1] "c" "a" "b" "e" "d"
> match(x,y) #x在y中的向量下標
[1] 2 3 1 5 4
> y[match(x,y)]
[1] "a" "b" "c" "d" "e"
> ## [1] "a" "b" "c" "d" "e"
> kids = c("jimmy","doodle","nicker","lucy","tony")
> scores = c(100,59,73,95,45)
> sort(scores) #將向量從小到大排列
[1] 45 59 73 95 100
> order(scores) #將向量中元素在sort后的位置標出
[1] 5 2 3 4 1
> kids[order(scores)] #按order的下標排序c
[1] "tony" "doodle" "nicker" "lucy" "jimmy"
向量的幾個進階小問題
1.兩個不同類型的向量合并在一起會怎么樣?
2.如何將兩個向量合到一起,組成一個長向量?
3.如何在向量首/尾/中間某位置增加一個元素?
4.如果向量x和y內(nèi)容一致但順序不一致,如何按照x的順序排列y?https://mp.weixin.qq.com/s/2eJPrT7lz562vX0ij4gfVg