生信星球?qū)W習(xí)小組第80期 Day6筆記--ZJUSKY

R包的學(xué)習(xí)

設(shè)置鏡像

在tools-options中是可以更改CRAN的鏡像的,但是沒法更改Bioconductor。(有時(shí)CRAN中沒有收錄的包可以在Bioconductor中嘗試下載)
在R的配置文件中進(jìn)行修改即可。

file.edit('~/.Rprofile')

然后再輸入

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源

保存退出即可。

options()$repos      #查看CRAN的鏡像
options()$BioC_mirror   #查看Bioconductor的鏡像

安裝包

一般先嘗試在CRAN中下載包。

install.packages("包的名字")

如果沒有這個(gè)包可以嘗試在Bioconductor中下載。

BiocManager::install(“包”)

加載包

library(包)
require(包)

安裝好包之后一定要加載才可以使用。

以下以dplyr為例簡(jiǎn)單介紹R包

dplyr

出處:AI入門學(xué)習(xí)
dplyr包主要用于數(shù)據(jù)清洗和整理,主要功能有:行選擇、列選擇、統(tǒng)計(jì)匯總、窗口函數(shù)、數(shù)據(jù)框交集等,是非常高效、友好的數(shù)據(jù)處理包.

安裝、加載dplyr

install.packages("dplyr")
library(dplyr)

示例所用數(shù)據(jù)為內(nèi)置iris的簡(jiǎn)化版。

Iris數(shù)據(jù)集是常用的分類實(shí)驗(yàn)數(shù)據(jù)集,由Fisher, 1936收集整理。Iris也稱鳶尾花卉數(shù)據(jù)集,是一類多重變量分析的數(shù)據(jù)集。數(shù)據(jù)集包含150個(gè)數(shù)據(jù)樣本,分為3類,每類50個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)包含4個(gè)屬性??赏ㄟ^花萼長(zhǎng)度,花萼寬度,花瓣長(zhǎng)度,花瓣寬度4個(gè)屬性預(yù)測(cè)鳶尾花卉屬于(Setosa,Versicolour,Virginica)三個(gè)種類中的哪一類。

test <- iris[c(1:2,51:52,101:102),]

dplyr的5個(gè)基本函數(shù)

1.新增列,mutate()

增加一列,命名為new,輸出結(jié)果為Sepal.Length * Sepal.Width。


2.按列篩選,select()

選擇第二列,第1列和第3列,Petal.width這列。


3. 按行篩選,filter()

4.按列的數(shù)值大小排序,arrange()

5.匯總,summarise()

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容