學習小組Day6筆記--AOK

R包學習-dplyr

生信星球Day6-R包.png

一、安裝和加載R包

1.鏡像設(shè)置:

參考 你還在每次配置Rstudio的下載鏡像嗎?

2.安裝:

CRAN:install.packages(“包”) 或者 Biocductor: BiocManager::install(“包”)

3. 加載:

library(包)require(包)

#示例:
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
install.packages("dplyr")
library(dplyr)

二、dplyr五個基礎(chǔ)函數(shù)

(以下示例數(shù)據(jù)皆為 內(nèi)置數(shù)據(jù)集iris的簡化版: test <- iris[c(1:2,51:52,101:102),]

原始狀態(tài)

1. 新增列 :mutate()

新增列

2. 按列篩選 :select()

2.1 按列號篩選

按列號

2.2 按列名篩選

按列名篩選.png
差別在這里:

選擇 字符向量 中的列,select中不能直接使用字符向量篩選,需要使用one_of函數(shù)

3. 篩選行:filter()

按行篩選

4. 按某1列或某幾列對整個表格進行排序: arrange()

排列.png

5.匯總/計算:summarise()

*結(jié)合group_by使用實用性強

匯總.png

三、dplyr兩個實用技能

1. 管道操作 %>% (cmd/ctr + shift + M)

一次性完成了上面的步驟

%>%管道操作符,運用起來特別方便,能夠連接前后兩個步驟,實現(xiàn)嵌套使用簡化代碼的同時還能避免存儲多余的中間值而節(jié)省內(nèi)存空間。它的作用是把符號左側(cè)返回的結(jié)果,作為符號右側(cè)調(diào)用函數(shù)的第1個參數(shù)。

  • 加載任意一個tidyverse包即可用管道符號

Tidyverse包是一個數(shù)據(jù)科學套件,讓數(shù)據(jù)工作流變得更加簡單和高效。包括:

  • dplyr包:用于數(shù)據(jù)操作和處理,常用的函數(shù)filter(), select(), mutate(), arrange(), group_by(), summarise()等,非常高效地完成數(shù)據(jù)選擇、排序、聚合。
  • ggplot2包:用于數(shù)據(jù)可視化。
  • tidyr包:用于數(shù)據(jù)的整潔。pivot_longer()函數(shù)把數(shù)據(jù)轉(zhuǎn)換為長數(shù)據(jù);pivot_wider()函數(shù)把數(shù)據(jù)轉(zhuǎn)換為寬數(shù)據(jù)。
  • readr包:用于數(shù)據(jù)的讀取。
  • forcats包:用于因子類型的管理。
  • purrr包:用于函數(shù)式編程

2. count統(tǒng)計某列的unique值


四、dplyr處理關(guān)系數(shù)據(jù)

(以下示例數(shù)據(jù)設(shè)置)

數(shù)據(jù)設(shè)置

1. 內(nèi)連inner_join:取交集

內(nèi)連

2. 左連left_join

左連

3. 全連full_join

全連

4. 半連接:返回能夠與y表匹配的x表所有記錄semi_join

半連接

5. 反連接:返回無法與y表匹配的x表的所記錄anti_join

反連接.png

6. 簡單合并

數(shù)據(jù)準備.png
簡單連接.png

以上
From 生信星球?qū)W習小組第130期

參考:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • R語言基礎(chǔ) R是一種編程語言,也是統(tǒng)計計算和繪圖的環(huán)境,匯集了許多函數(shù),能夠提供強大的功能,R語言軟件界面簡陋,通...
    jn_0860閱讀 163評論 0 0
  • 時隔一年,再次更新 1 Python 模擬簽到[http://127.0.0.1:8888/notebooks/...
    夜羽蕭軒閱讀 226評論 0 1
  • scrapy學習筆記(有示例版) 我的博客 scrapy學習筆記1.使用scrapy1.1創(chuàng)建工程1.2創(chuàng)建爬蟲模...
    陳思煜閱讀 13,085評論 4 46
  • 2021-08-15 六西格瑪管理(Six Sigma Management)是20世紀80年代末首先在美國摩托羅...
    雪左左閱讀 1,556評論 0 0
  • 線性回歸、邏輯斯蒂回歸、支持向量機、神經(jīng)網(wǎng)絡(luò)、異常檢測和主成分分析參照Andrew Ng主講課程《機器學習》 目錄...
    AkaToKuro閱讀 595評論 0 0

友情鏈接更多精彩內(nèi)容