安裝加載三部曲
options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr"→可換成其他R包的名字)
library(dplyr)
dplyr五個函數
-
mutate()新增列 -
select()按列篩選 -
filter()按行篩選 -
arrange()按某1列或某幾列對整個表格進行排序
默認從小到大,arrange(變量,desc(列名))從大到小 -
summarise()匯總
group_by()按xx分組
dplyr兩個實用技能
管道操作
%>%(cmd/ctr+shift+M)
管道運算符%>%:將一個函數的輸出傳遞給另一個函數作為參數統(tǒng)計某列的unique值
count()
dplyr處理關系數據
- 內連
inner_join(),取交集 - 左連
left_join() - 全連
full_join() - 半連接:返回能夠與y表匹配的x表所有記錄
semi_join() - 反連接:返回無法與y表匹配的x表所有記錄
anti_join() - 簡單合并
bind_rows()需要兩個表格列數相同
bind_cols()需要兩個數據框有相同的行數