TCGA表達(dá)矩陣行名一鍵轉(zhuǎn)換

直接說(shuō)答案,新版的tinyarray里面加了一個(gè)函數(shù),trans_exp_new,pia的以下就轉(zhuǎn)換成功,不只是TCGA的,任何以ensembleid為行名的矩陣都可以轉(zhuǎn)換,注意數(shù)據(jù)結(jié)構(gòu)得是矩陣哦。

1.讀取數(shù)據(jù)

隨便拿一個(gè)例子,xena里的一個(gè)CHOL數(shù)據(jù),在這里下載:

https://gdc-hub.s3.us-east-1.amazonaws.com/download/TCGA-CHOL.htseq_counts.tsv.gz

dat = read.delim("TCGA-CHOL.htseq_counts.tsv.gz",check.names = F,row.names = 1)
dat = as.matrix(dat)
dat[1:4,1:4]
#>                    TCGA-ZD-A8I3-01A TCGA-W5-AA2U-11A TCGA-W5-AA30-01A
#> ENSG00000000003.13        12.359475        11.274378         12.32559
#> ENSG00000000005.5          1.000000         1.000000          0.00000
#> ENSG00000000419.11        10.244364         9.357552         10.68387
#> ENSG00000000457.12         9.558421         8.438792         11.37341
#>                    TCGA-W5-AA38-01A
#> ENSG00000000003.13        13.010178
#> ENSG00000000005.5          1.000000
#> ENSG00000000419.11        10.728771
#> ENSG00000000457.12         9.022368

2.表達(dá)矩陣行名ID轉(zhuǎn)換

#install.packages("tinyarray")
library(tinyarray)
exp = trans_exp_new(dat)
#> Warning in AnnoProbe::annoGene(rownames(exp), ID_type = "ENSEMBL"): 6.54% of
#> input IDs are fail to annotate...
exp[1:4,1:4]
#>             TCGA-ZD-A8I3-01A TCGA-W5-AA2U-11A TCGA-W5-AA30-01A TCGA-W5-AA38-01A
#> DDX11L1             0.000000         0.000000         0.000000         1.000000
#> WASH7P              6.357552         3.459432         7.199672         5.807355
#> MIR6859-1           1.000000         0.000000         3.584963         1.000000
#> MIR1302-2HG         0.000000         0.000000         0.000000         0.000000

總數(shù)六萬(wàn),少掉6%根本不叫事。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容