
R包
R包是多個(gè)函數(shù)的集合,具有詳細(xì)的說明和示例。
一、安裝和加載R包
1.配置國(guó)內(nèi)鏡像
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
你還在每次配置Rstudio的下載鏡像嗎? (qq.com)
2.安裝
install.packages(“包”)
或
BiocManager::install(“包”)
3.加載
library(包)
或
require(包)
4.以dplyr為例的全過程
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
test <- iris[c(1:2,51:52,101:102),] #示例數(shù)據(jù)
二、dplyr五個(gè)基礎(chǔ)函數(shù)
1.mutate():新增列
mutate(test, new = Sepal.Length * Sepal.Width)相比原test新增new列

2.select():按列篩選
(1)按列號(hào)篩選
select(文件,列號(hào))
列號(hào)表述形式與之前相同。
(2)按列名篩選
select(文件,列名)
多列名間用逗號(hào)分割。
one_of():聲明選擇對(duì)象

3.filter():篩選行
filter(test, Species == "setosa"&Sepal.Length > 5 )
多個(gè)篩選條件間用&連接

4.arrange():按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序
arrange(test, 參照列)
默認(rèn)排序?yàn)閰⒄樟袕男〉酱?,?code>desc(列名)改為從大到小

5.summarise():匯總
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
mean():計(jì)算某列平均值
sd():計(jì)算某列標(biāo)準(zhǔn)差
group_by(文件,列名):按照列名分組


三、dplyr兩個(gè)實(shí)用技能
1、管道操作:%>% (快捷鍵cmd/ctrl + shift + M)
需要提前library(tidyverse)加載tidyverse包。
與linux中|管道相似,將管道前操作的輸出信息,變成管道后操作的輸入信息。

2、count:統(tǒng)計(jì)某列的unique值
count(文件,列名)

四、dplyr處理關(guān)系數(shù)據(jù)
test1 <- data.frame(x = c('b','e','f','x'),
z = c("A","B","C",'D'),
stringsAsFactors = F)
test2 <- data.frame(x = c('a','b','c','d','e','f'),
y = c(1,2,3,4,5,6),
stringsAsFactors = F)


先定義兩個(gè)表test1和test2。
stringsAsFactors=F:“在讀入數(shù)據(jù)時(shí),遇到字符串之后,不將其轉(zhuǎn)換為factors,仍然保留為字符串格式”
1.內(nèi)連 inner_join:取交集行
by = '鏈接列'

2.左連 left_join:取前者表格的行


3.全連 full_join:取并集行

4.半連接 semi_join:取x與y交集行 對(duì)應(yīng)的x表數(shù)據(jù)

5.反連接 anti_join:取x與y非交集行 對(duì)應(yīng)的x表數(shù)據(jù)


6.簡(jiǎn)單合并
等于base包的cbind()函數(shù)和rbind()函數(shù)。
條件:
bind_rows()函數(shù):兩個(gè)表格列數(shù)相同。(上下結(jié)合)
bind_cols()函數(shù):兩個(gè)數(shù)據(jù)框有相同的行數(shù)。(左右結(jié)合)




