學(xué)習(xí)小組Day6 ---小陳

好巧 在學(xué)習(xí)課程之前自己先安裝了Biocductor,想要安裝chipseeker包,出現(xiàn)了一些問(wèn)題;希望學(xué)完這個(gè)課程,能解決現(xiàn)在存在的問(wèn)題。

*   R包是多個(gè)函數(shù)的集合,具有詳細(xì)的說(shuō)明和示例。

*   學(xué)生信,R語(yǔ)言必學(xué):豐富的圖表和Biocductor上面的各種生信分析R包。

*   包的使用 一通百通(以dplyr為例學(xué)習(xí)R包)

*   R平臺(tái)細(xì)節(jié):

    *   R version 4.0.3 (2020-10-10)

    *   Platform: x86_64-w64-mingw32/x64 (64-bit)

    *   用'citation()'會(huì)告訴你如何在出版物中正確地引用R或R程序包。

    *   用'demo()'來(lái)看一些示范程序,用'help()'來(lái)閱讀在線(xiàn)幫助文件,或

    *   用'help.start()'通過(guò)HTML瀏覽器來(lái)看幫助文件。

    *   用'q()'退出R.

安裝和加載R包

1.鏡像設(shè)置:兩行代碼()可以搞定;失敗的話(huà)就每次需要下載R包時(shí)運(yùn)行這兩句代碼即可。配置Rstudio的下載鏡像(是CRAN的鏡像)

(1)初級(jí)模式:設(shè)置流程tool-packages-primary CRAN repository(change)-Tsinghau;下載Bioconductor的包,這個(gè)鏡像是沒(méi)有辦法用的;通過(guò)options()$repos來(lái)檢驗(yàn) Rstudio是不是從CRAN去下載包。
(2)升級(jí)模式:自定義CRAN和Bioconductor的下載鏡像,在Rstudio中進(jìn)行設(shè)置:運(yùn)行這兩行代碼

options函數(shù)就是設(shè)置R運(yùn)行過(guò)程中的一些選項(xiàng)設(shè)置

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
(3) 高級(jí)模式:

R的配置文件 .Rprofile:.Rprofile就是一個(gè)代碼文件,如果啟動(dòng)時(shí)找到這個(gè)文件,那么就替我們先運(yùn)行一遍(這個(gè)過(guò)程就是在啟動(dòng)Rstudio時(shí)完成的

用file.edit()來(lái)編輯文件: file.edit('~/.Rprofile')
添加好上面??的兩行options代碼:
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
保存=》
重啟Rstudio,這時(shí)你再運(yùn)行一下:options()repos 和options()BioC_mirror
配置完成
2.安裝
聯(lián)網(wǎng)
R包安裝命令是install.packages(“包”)或者BiocManager::install(“包”);注 取決于要安裝的包存在于CRAN網(wǎng)站還是Biocductor,存在于哪里?可以谷歌搜到。
加載
兩個(gè)命令均可:

    *   library(包)

    *   require(包)
  • 安裝加載三部曲

  • dplyr五個(gè)基礎(chǔ)函數(shù)

    • dplyr包主要用于數(shù)據(jù)清洗和整理,主要功能有:行選擇、列選擇、統(tǒng)計(jì)匯總、窗口函數(shù)、數(shù)據(jù)框交集等;是非常高效、友好的數(shù)據(jù)處理包,大大提高數(shù)據(jù)處理及分析效率。

    • 1.mutate(),新增列:

      • mutate(test, new = Sepal.Length * Sepal.Width)
    • 2. select(),按列篩選:

      • 1)按列號(hào)篩選 :

        • select(test,1)--- test文件的第一列

        • select(test,c(1,5))--- test文件的第一和第五列

        • select(test,Sepal.Length) ---Sepal.Length這一列

      • 2)按列名篩選:

        • select(test, Petal.Length, Petal.Width)----Petal.Length, Petal.Width的這兩列

        • vars <- c("Petal.Length", "Petal.Width")

select(test, one_of(vars))

*   3.filter()篩選行【先固定列,再按行的元素篩選】

    *   filter(test, Species == "setosa") 篩選列 Species 中含setosa行

    *   filter(test, Species == "setosa"&Sepal.Length > 5 )篩選列 Species 中含setosa行。并且&Sepal.Length > 5

    *   filter(test, Species %in% c("setosa","versicolor")) 篩選前面一個(gè)向量Species 內(nèi)的元素是否在后面一個(gè)向量中c("setosa","versicolor"); "setosa","versicolor" 就是一個(gè)篩選條件

*   4.arrange(),按某一列或某幾列對(duì)整個(gè)表格進(jìn)行排序

    *   arrange(test, Sepal.Length) # 默認(rèn)從小到大排序

    *   arrange(test, desc(Sepal.Length)) # 用desc從大到小

*   5.summarise():匯總

    *   對(duì)數(shù)據(jù)進(jìn)行匯總操作,結(jié)合group_by使用實(shí)用性強(qiáng)

        *   summarise(test, mean(Sepal.Length), sd(Sepal.Length)) # 計(jì)算;Sepal.Length的平均值和標(biāo)準(zhǔn)差

先按照Species分組,計(jì)算每組Sepal.Length的平均值和標(biāo)準(zhǔn)差

group_by(test, Species)

summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))

dplyr兩個(gè)實(shí)用技能

管道操作 %>% (cmd/ctr + shift + M)

test %>%

group_by(Species) %>%

summarise(mean(Sepal.Length), sd(Sepal.Length))

count 統(tǒng)計(jì)某列的unique值

count(test,Species)

dplyr處理關(guān)系數(shù)據(jù):即將2個(gè)表進(jìn)行連接,注意:不要引入factor

1.內(nèi)連inner_join,取交集

inner_join(test1, test2, by = "x")

2.左連left_join :

left_join(test1, test2, by = 'x') 依據(jù)text1的x取交集

left_join(test2, test1, by = 'x') 依據(jù)text2的x取交集,空值輸出NA補(bǔ)全

3.全連full_join

full_join( test1, test2, by = 'x') ;full_join( test2, test1, by = 'x')

4.半連接semi_join:

返回能夠與y表匹配的x表所有記錄:semi_join(x = test1, y = test2, by = 'x')

5.反連接anti_join:

返回?zé)o法與y表匹配的x表的所記錄:anti_join(x = test2, y = test1, by = 'x')

6.簡(jiǎn)單合并bind_rows():

相當(dāng)于base包里的cbind()函數(shù)和rbind()函數(shù);

注意,bind_rows()函數(shù)需要兩個(gè)表格列數(shù)相同,

而bind_cols()函數(shù)則需要兩個(gè)數(shù)據(jù)框有相同的行數(shù)

小組學(xué)習(xí)Day 6 --小陳 ___ https___rstudio.com_resources_cheatsheets_.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容