【生信技能樹::作業(yè)&習(xí)題】R語言初級練習(xí)題-修正

R 語言初級習(xí)題中我下載的樣本信息盡管還是那個內(nèi)容,但并不是最好的下載方式,也不是習(xí)題要求中的表格。那個表格的可讀性太差了。Jimmy官方給了一個如何用R獲取GEO樣本信息的鏈接。根據(jù)這個教程,我接著修正前面的作業(yè)內(nèi)容,然后接著完成后面的習(xí)題。

不過上次下錯文件陰差陽錯給了我聯(lián)系read.table的機會,讓我學(xué)會了用平時沒有用到的參數(shù)skip和fill。所以我不打算直接刪除和修改,而是重新寫一篇。

  1. 下載 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE111229 里面的樣本信息讀入到R里面,了解這個數(shù)據(jù)框,多少列,每一列都是什么屬性的元素。

    其實在GEO accession display的頁面里就有可以直接跳轉(zhuǎn)的地方。見下

樣本信息-1.png

點開more在下面點擊第一個鏈接(印象中去年還是前年的時候沒有這個鏈接)

樣本信息-2.png

進到這里,類似一個數(shù)據(jù)中心一樣,點擊Export

樣本信息-3.png

用mac預(yù)覽打開看看,嗯,整整齊齊!

樣本信息-4.png
options(stringsAsFactors = F)
b <- read.csv("sample.csv")
  1. 把兩個表關(guān)聯(lián)起來,使用merge函數(shù)。

    偷個懶,后面參考習(xí)題下面的答案

    colnames(rit); colnames(b)
    d = merge(rit, b, by,x = 'Sample_Name', by,y = 'Accession')
    e = d[, c("MBases", "Titles")]
    
  1. 對前面讀取的 RunInfo Table 文件在R里面探索其MBases列,包括 箱線圖(boxplot)和五分位數(shù)(fivenum),還有頻數(shù)圖(hist),以及密度圖(density) 。

  2. 把前面讀取的樣本信息表格的樣本名字根據(jù)下劃線分割看第3列元素的統(tǒng)計情況。第三列代表該樣本所在的plate

    plate = unlist(lapply(e[,2],function(x){
      x
      strsplit(x, '_')[[1]][3]
    }))
    table(plate)
    e$plate = plate
    
  1. 根據(jù)plate把關(guān)聯(lián)到的 RunInfo Table 信息的MBases列分組檢驗是否有統(tǒng)計學(xué)顯著的差異。

    boxplot(e[,1] ~ plate)
    t.test(e[,1] ~ plate)
    # or
    boxplot(MBases ~ plate, data = e)
    
  1. 分組繪制箱線圖(boxplot),頻數(shù)圖(hist),以及密度圖(density) 。

  2. 使用ggplot2把上面的圖進行重新繪制。

    library(ggplot2)
    ggplot(e,aes(x=plate,y=MBases))+geom_boxplot()
    
  1. 使用ggpubr把上面的圖進行重新繪制。

    library(ggpubr)
    p <- ggboxplot(e, x = "plate", y = "MBases",
     color = "plate", palette = "jco",
     add = "jitter")
    # Add p-value
    p + stat_compare_means(method = 't.test')
    
  1. 隨機取384個MBases信息,跟前面的兩個plate的信息組合成新的數(shù)據(jù)框,第一列是分組,第二列是MBases,總共是384*3行數(shù)據(jù)。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容