Learning 'dplyr' package
處理數(shù)據(jù)神器'dplyr'包

dplyr cheat sheet.jpg

dplyr cheat sheet.jpg
mutate()
mutate(data, new_var = expression… )
根據(jù)公式計(jì)算產(chǎn)生新列
select()
select(data, …)
根據(jù)列號(hào)或者列名選出對(duì)應(yīng)列
-為剔除該列
select(df,-a)
剔除a列
filter()
filter(data, logical expression)
根據(jù)邏輯表達(dá)式選出對(duì)應(yīng)觀測(cè)(行)
arrange()
arrange(.data, x, .by_group = FALSE
按x進(jìn)行排序, 可以按多個(gè)變量進(jìn)行排序, 默認(rèn)為升序排列
desc(x)
按x降序排列
group_by()
group_by(df, x)
對(duì)x進(jìn)行分組
ungroup
取消分組
summarise()
summarize(data, var = func())
匯總分析, 可以聯(lián)合group_by()一起用進(jìn)行分組匯總
管道操作 %>%
將左邊的對(duì)象作為第一個(gè)參數(shù)傳遞到右邊的函數(shù)中
x %>% f(y)等價(jià)于f(x,y)
連接

Combine table in dplyr.jpg