R包的學(xué)習(xí)
設(shè)置鏡像
在tools-options中是可以更改CRAN的鏡像的,但是沒法更改Bioconductor。(有時(shí)CRAN中沒有收錄的包可以在Bioconductor中嘗試下載)
在R的配置文件中進(jìn)行修改即可。
file.edit('~/.Rprofile')
然后再輸入
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
保存退出即可。
options()$repos #查看CRAN的鏡像
options()$BioC_mirror #查看Bioconductor的鏡像
安裝包
一般先嘗試在CRAN中下載包。
install.packages("包的名字")
如果沒有這個(gè)包可以嘗試在Bioconductor中下載。
BiocManager::install(“包”)
加載包
library(包)
require(包)
安裝好包之后一定要加載才可以使用。
以下以dplyr為例簡(jiǎn)單介紹R包
dplyr
出處:AI入門學(xué)習(xí)
dplyr包主要用于數(shù)據(jù)清洗和整理,主要功能有:行選擇、列選擇、統(tǒng)計(jì)匯總、窗口函數(shù)、數(shù)據(jù)框交集等,是非常高效、友好的數(shù)據(jù)處理包.
安裝、加載dplyr
install.packages("dplyr")
library(dplyr)
示例所用數(shù)據(jù)為內(nèi)置iris的簡(jiǎn)化版。
Iris數(shù)據(jù)集是常用的分類實(shí)驗(yàn)數(shù)據(jù)集,由Fisher, 1936收集整理。Iris也稱鳶尾花卉數(shù)據(jù)集,是一類多重變量分析的數(shù)據(jù)集。數(shù)據(jù)集包含150個(gè)數(shù)據(jù)樣本,分為3類,每類50個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)包含4個(gè)屬性??赏ㄟ^花萼長(zhǎng)度,花萼寬度,花瓣長(zhǎng)度,花瓣寬度4個(gè)屬性預(yù)測(cè)鳶尾花卉屬于(Setosa,Versicolour,Virginica)三個(gè)種類中的哪一類。
test <- iris[c(1:2,51:52,101:102),]
dplyr的5個(gè)基本函數(shù)
1.新增列,mutate()
增加一列,命名為new,輸出結(jié)果為Sepal.Length * Sepal.Width。

2.按列篩選,select()
選擇第二列,第1列和第3列,Petal.width這列。

3. 按行篩選,filter()

4.按列的數(shù)值大小排序,arrange()

5.匯總,summarise()
