需求
下表是從miRNA預(yù)測(cè)工具Funrich軟件中導(dǎo)出的?數(shù)據(jù)。
需要整理成:
兩列,一列是gene,一列miRNA,每對(duì)mRNA-miRNA組合占一行,形如:

思路
1.第二列miRNA進(jìn)行分割,分隔符為;
2.每個(gè)基因?qū)?yīng)多少個(gè)miRNA,就重復(fù)多少次放在第一列。
3.miRNA依次排列即可。
代碼實(shí)現(xiàn)
輸入數(shù)據(jù)可以自己編一個(gè)。也可以在生信星球公眾號(hào)回復(fù)“mi636”獲得。
library(rio)
x = import_list("miRNA.xlsx")
x2=x$Detail
x2
colnames(x2)=x2[2,]
x2 = x2[-c(1,2),]
library(stringr)
x3 = str_split(x2$miRNA,"; ")
x3 = lapply(x3, function(x){str_remove(x,";")})
df = data.frame(gene = rep(x2$`Gene symbol`,times = sapply(x3,length)),
miRNA = unlist(x3))
export(df,"miRNA_cyto.txt")
(^-^)V搞定!
下次有一個(gè)互作網(wǎng)絡(luò)圖復(fù)現(xiàn)的視頻講解,劇透一個(gè):
