學(xué)習(xí)R包
1、鏡像設(shè)置
編輯R的配置文件.Rprofile,Rstudio啟動(dòng)時(shí)會(huì)運(yùn)行這個(gè)文件,相當(dāng)于開機(jī)啟動(dòng)鏡像配置。配置操作如下:
file.edit('~/.Rprofile')
在彈出的Rprofile框中添加options代碼:
來自生信星球
# options函數(shù)就是設(shè)置R運(yùn)行過程中的一些選項(xiàng)設(shè)置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對應(yīng)中科大源
# 當(dāng)然可以換成其他地區(qū)的鏡像
保存,重啟Rstudio,運(yùn)行options()$repos 和options()$BioC_mirror查看配置。

image.png
2、安裝
R包安裝命令install.packages("包")或者BiocManager::install("包")。取決于要安裝的包存在于CRAN網(wǎng)站還是Bioconductor。
3、加載
加載命令包括:
library(包)
require(包)
安裝加載三部曲(來自生信星球)
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
示例數(shù)據(jù)
test <- iris[c(1:2,51:52,101:102),]
上述安裝包dplyr五個(gè)基礎(chǔ)函數(shù)使用:
1)mutate(),新增列

image.png
2)
select(),按列篩選按列號篩選:

image.png
按列名篩選:

image.png
注:
vars() :A character vector of variable names. When called from inside selecting functions like.
3)
filter(),篩選行
image.png
4)
arrange(),按某一列或某幾列對整個(gè)表格進(jìn)行排序
image.png
5)
summarise(),匯總對數(shù)據(jù)進(jìn)行匯總操作,結(jié)合group_by使用實(shí)用性強(qiáng)。

image.png
dplyr使用技能
1、管道操作%>%(cmd/ctr+shift+M)

image.png
2、count統(tǒng)計(jì)某列的unique值

image.png
dplyr處理關(guān)系數(shù)據(jù)
將2個(gè)表進(jìn)行連接,注意不要引入factor??

image.png

image.png

image.png

image.png