GPL平臺注釋,如何從gene_assinment中挖出gene symbol
https://www.bioinfo.info/?/question/6112
在做芯片分析時,得到了差異基因的list,但是讀入GPL6244的注釋文件發(fā)現(xiàn)gene symbol不是單獨的一列,而是隱藏在gene_assignment這一列中間。怎么才能注釋得到gene symbol結(jié)果?
回復1:這個你可以把 gene_assignment這一列取出來,然后使用 // 分割, 取分割以后的第1列即可。R里面limma包有個函數(shù)好像叫? strsplit2() ,你可以試試。
回復2:
library(tidyverse)
symbol<-str_split_fixed(annotation_file$gene_assignment,pattern = "http://",3)[,2]
