生信星球?qū)W習(xí)小組day6-學(xué)習(xí)R包心得——Milin我心

以R包dplyr為例,學(xué)習(xí)以下代碼

首先安裝dplyr,由于之前已經(jīng)install.packages("tidyverse"),而tidyverse包括R包dplyr,所以安裝即library(tidyverse)后dplyr也被安裝了

1. 新增列,mutate,以iris數(shù)據(jù)集(簡(jiǎn)版)為例,首先賦予test為iris數(shù)據(jù)集(簡(jiǎn)版),然后mutate(test, new = Sepal.Length * Sepal.Width)即新增了乘積的一列。

2. 按列篩選,select(test, ),空白填名稱、順序都行

3. 按行篩選,例如filter(test, Species == "setosa"),然后filter(test, Species == "setosa"&Sepal.Length > 5 )進(jìn)一步篩選,縮小范圍

4. 按列對(duì)表格排序,arrange(test, Sepal.Length)#默認(rèn)從小到大排序,改變默認(rèn),則arrange(test, desc(Sepal.Length))#表示由大到小,desc即decend后退

5. 匯總,summarise(test, mean(Sepal.Length), sd(Sepal.Length))計(jì)算Sepal.Length的平均值和標(biāo)準(zhǔn)差,也可以group_by(test, Species)分亞之后在統(tǒng)計(jì)平均值和標(biāo)準(zhǔn)差

6. 統(tǒng)計(jì)某列的unique值,如count(test,Species)

7. 將幾列數(shù)連接成表,如```test1 <- data.frame(x = c('b','e','f','x'),

                z = c("A","B","C",'D'),
                stringsAsFactors = F)```,包括內(nèi)連接、左連接、右連接、全連接等幾種形式,對(duì)映集合的幾種形式,另外用```bind_rows(test1, test2)```,```bind_cols(test1, test3)```可以分別對(duì)列相同、行相同數(shù)的表格進(jìn)行合并
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容