學(xué)習(xí)小組Day6——宣Xuanan

image

R包

R包是多個(gè)函數(shù)的集合,具有詳細(xì)的說明和示例。

一、安裝和加載R包

1.配置國(guó)內(nèi)鏡像

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源

你還在每次配置Rstudio的下載鏡像嗎? (qq.com)

2.安裝

install.packages(“包”)

BiocManager::install(“包”)

3.加載

library(包)

require(包)

4.以dplyr為例的全過程

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

test <- iris[c(1:2,51:52,101:102),] #示例數(shù)據(jù)

二、dplyr五個(gè)基礎(chǔ)函數(shù)

1.mutate():新增列

mutate(test, new = Sepal.Length * Sepal.Width)相比原test新增new列

image

2.select():按列篩選

(1)按列號(hào)篩選
select(文件,列號(hào))
列號(hào)表述形式與之前相同。
(2)按列名篩選
select(文件,列名)
多列名間用逗號(hào)分割。

one_of():聲明選擇對(duì)象

image

3.filter():篩選行

filter(test, Species == "setosa"&Sepal.Length > 5 )
多個(gè)篩選條件間用&連接

image

4.arrange():按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序

arrange(test, 參照列)
默認(rèn)排序?yàn)閰⒄樟袕男〉酱?,?code>desc(列名)改為從大到小

image

5.summarise():匯總

summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
mean():計(jì)算某列平均值
sd():計(jì)算某列標(biāo)準(zhǔn)差
group_by(文件,列名):按照列名分組

image
image

三、dplyr兩個(gè)實(shí)用技能

1、管道操作:%>% (快捷鍵cmd/ctrl + shift + M)

需要提前library(tidyverse)加載tidyverse包。
與linux中|管道相似,將管道前操作的輸出信息,變成管道后操作的輸入信息。

image

2、count:統(tǒng)計(jì)某列的unique值

count(文件,列名)

image

四、dplyr處理關(guān)系數(shù)據(jù)

test1 <- data.frame(x = c('b','e','f','x'), 
                    z = c("A","B","C",'D'),
                    stringsAsFactors = F)

test2 <- data.frame(x = c('a','b','c','d','e','f'), 
                    y = c(1,2,3,4,5,6),
                    stringsAsFactors = F)

image
image

先定義兩個(gè)表test1和test2。

stringsAsFactors=F:“在讀入數(shù)據(jù)時(shí),遇到字符串之后,不將其轉(zhuǎn)換為factors,仍然保留為字符串格式”

1.內(nèi)連 inner_join:取交集行
by = '鏈接列'

image

2.左連 left_join:取前者表格的行

image
image

3.全連 full_join:取并集行

image

4.半連接 semi_join:取x與y交集行 對(duì)應(yīng)的x表數(shù)據(jù)

image

5.反連接 anti_join:取x與y非交集行 對(duì)應(yīng)的x表數(shù)據(jù)

image
image

6.簡(jiǎn)單合并
等于base包的cbind()函數(shù)和rbind()函數(shù)。

條件:
bind_rows()函數(shù):兩個(gè)表格列數(shù)相同。(上下結(jié)合)
bind_cols()函數(shù):兩個(gè)數(shù)據(jù)框有相同的行數(shù)。(左右結(jié)合)

image
image
image
image
image
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容