Day6-學(xué)習(xí)R包

image.png
1、安裝和加載R包
1.1鏡像設(shè)置
1.1.1初級(jí)模式:用options()$repos檢驗(yàn)

image.png
1.1.2升級(jí)模式:用
options()$BioC_mirror檢驗(yàn)
image.png
1.1.3高級(jí)模式:R的配置文件 .Rprofile
Rstudio最重要的兩個(gè)配置文件:
(1)在剛開始運(yùn)行Rstudio的時(shí)候,程序會(huì)查看許多配置內(nèi)容,其中一個(gè)就是
.Renviron,它是為了設(shè)置R的環(huán)境變量;(2)
.Rprofile就是一個(gè)代碼文件,如果啟動(dòng)時(shí)找到這個(gè)文件,那么就替我們先運(yùn)行一遍(這個(gè)過程就是在啟動(dòng)Rstudio時(shí)完成的)file.edit()編輯文件
1.2安裝R包
R包安裝命令是install.packages(“包名”)#BiocManager::install(“包名”)

image.png

image.png
1.3加載包
library(包)

image.png
2、dplyr五個(gè)基礎(chǔ)函數(shù)
2.1.mutate(),新增列
image.png

image.png
2.2.select(),按列篩選
(1)按列號(hào)篩選

image.png

image.png
2.3.filter()篩選行

image.png
2.4.arrange(),按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序
image.png

image.png
2.5.summarise():匯總

image.png

image.png

image.png
3、dplyr兩個(gè)實(shí)用技能
3.1、管道操作 %>% (cmd/ctr + shift + M)

image.png
3.2、count統(tǒng)計(jì)某列的unique值
image.png

image.png
4、dplyr處理關(guān)系數(shù)據(jù)
即將2個(gè)表進(jìn)行連接,注意:不要引入factor
stringsAsFactors=FALSE就是不變成屬性數(shù)據(jù),按字符串讀入
data.frame()函數(shù)創(chuàng)建數(shù)據(jù)框,緊密耦合的變量集合,這些變量共享了矩陣和列表的許多屬性,它們被大多數(shù)R的建模軟件用作基本的數(shù)據(jù)結(jié)構(gòu)。

image.png
4.1.內(nèi)連inner_join,取交集
取x的交集數(shù)據(jù)
image.png

image.png
4.2、左連left_join

image.png

image.png
4.3、全連full_join

image.png

image.png
4.4.半連接:返回能夠與y表匹配的x表所有記錄semi_join
image.png

image.png
4.5.反連接:返回?zé)o法與y表匹配的x表的所記錄anti_join
image.png

image.png
4.6、簡(jiǎn)單合并
在相當(dāng)于base包里的cbind()函數(shù)和rbind()函數(shù);注意,bind_rows()函數(shù)需要兩個(gè)表格列數(shù)相同,而bind_cols()函數(shù)則需要兩個(gè)數(shù)據(jù)框有相同的行數(shù)
image.png