如何判斷你的GEO數(shù)據(jù)中的count值是否為log后的

我下載了4個GEO乳腺癌的數(shù)據(jù)集,想要把它們整合為一個數(shù)據(jù)集,在獲取了表達(dá)矩陣,提取了想要的數(shù)據(jù),并且注釋了探針名后,我想,終于可以整合了,然后,我就遇到了問題。
除了其中一個矩陣表達(dá)量都在3000左右,一看就需要log,其他的好像都是log后的。
怎樣批量判斷是否需要log化呢?
我就回去翻了果子老師的視頻,發(fā)現(xiàn)了一段代碼


# 自動log化
ex <- exprSet
qx <- as.numeric(quantile(ex, c(0., 0.25, 0.5, 0.75, 0.99, 1.0), na.rm=T))
LogC <- (qx[5] > 100) ||
  (qx[6]-qx[1] > 50 && qx[2] > 0) ||
  (qx[2] > 0 && qx[2] < 1 && qx[4] > 1 && qx[4] < 2)

if (LogC) { 
  ex[which(ex <= 0)] <- NaN
  exprSet <- log2(ex)
  print("log2 transform finished")
  }else{
    print("log2 transform not needed")
    }

用這個段代碼批量處理了我的四個數(shù)據(jù)集,發(fā)現(xiàn)一個需要log2,其他三個都不需要。
然后log2一個表達(dá)矩陣就好了~
然后我還有兩個問題沒有解決:
所有的GEO數(shù)據(jù)庫里的log都是取得log2嗎?就沒有哪個哥們想要log10一下?是不是值之間的差異就太小了?
第二,如何根據(jù)GSE號追溯回源文章呢?根據(jù)citation的好像不對啊
遇到的問題好多,要一點(diǎn)一點(diǎn)來了~
感悟:遇不到問題,是真的不會去好好看視頻做筆記的,哎。。。。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 健明大神說過若是想學(xué)會使用R包,就去看那個包的說明書,因此去學(xué)習(xí)了GEOquery包說明書。翻譯不當(dāng)之處請去看原文...
    土豆學(xué)生信閱讀 42,560評論 1 80
  • 以下是B站生信技能樹GEO數(shù)據(jù)庫挖掘的課程筆記 主要內(nèi)容及學(xué)習(xí)目的: 介紹GEO數(shù)據(jù)庫:了解數(shù)據(jù)存放位置; 介紹G...
    黃晶_id閱讀 50,736評論 66 386
  • 使用GEOquery包 肖恩戴維斯 2014年9月21日 1GEO概述 1.1平臺 1.2樣品 1.3系列 1.4...
    Greatji閱讀 1,094評論 0 1
  • GEO再學(xué)習(xí) GEO數(shù)據(jù)挖掘已經(jīng)成為生信學(xué)者必備技能,我以為自己會跑代碼了就是會了,其實(shí)呢,細(xì)細(xì)去領(lǐng)會每個細(xì)節(jié),還...
    小夢游仙境閱讀 3,575評論 0 26
  • 每天隨手拍,留住瞬間的美好~加倍美好!我們來啦! 本周主持——水若本周主題——【清涼一夏】 1、寶貝小魚兒——夏天...
    水若_小水囈夢閱讀 304評論 0 0

友情鏈接更多精彩內(nèi)容