R包是什么?
R包是大神們開發(fā)好的可以通過簡單的命令就實(shí)現(xiàn)各種強(qiáng)大功能的函數(shù)的集合。
安裝和加載R包
- 設(shè)置鏡像,把下載R包的源網(wǎng)址設(shè)置為國內(nèi)的鏡像,加快下載的速度。
-
install.packages()安裝CRAN上的包
BioManager::install()安裝Bioconductor上的包
加載R包
每次使用某個(gè)R包之前都需要先進(jìn)行加載。使用library()或者require()
dplyr包
mutate():在數(shù)據(jù)框中新增加一列
select():按列序號(hào)或者列名選擇指定的列
filter(): 篩選滿足某要求的行
arrange():按某一列或者某幾列對(duì)整個(gè)表格進(jìn)行排序
summarise():根據(jù)給定的函數(shù)進(jìn)行匯總,結(jié)合group_by可以進(jìn)行分組匯總。
dplyr實(shí)用技能
%>%管道操作,相當(dāng)于將上一函數(shù)的輸出結(jié)果,作為下一個(gè)函數(shù)的第一個(gè)參數(shù)進(jìn)行輸入。
count()統(tǒng)計(jì)某列的各類值的個(gè)數(shù)。
dplyr處理數(shù)據(jù)關(guān)系
根據(jù)連個(gè)數(shù)據(jù)框的某一列連接數(shù)據(jù)框
inner_join():相當(dāng)于取交集
left_join():根據(jù)左邊的數(shù)據(jù)框的列進(jìn)行合并
full_join():相當(dāng)于取兩個(gè)數(shù)據(jù)框的并集
semi_join():相當(dāng)于跟具第二個(gè)數(shù)據(jù)框中某一列,得到與第一個(gè)數(shù)據(jù)框匹配的值,但不輸出第二個(gè)數(shù)據(jù)框。
anti_join():得到無法與第二個(gè)數(shù)據(jù)框匹配的第一個(gè)數(shù)據(jù)框中的值
bind_rows():連接兩個(gè)列數(shù)一樣的數(shù)據(jù)框
bind_cols():連接兩個(gè)行數(shù)相同的數(shù)據(jù)框