人鼠基因名同源轉(zhuǎn)換

首先可以直接大小寫轉(zhuǎn)換:

dog <- "The quick brown dog"
str_to_upper(dog)
str_to_lower(dog)
str_to_title(dog)
str_to_sentence("the quick brown dog")
image.png

但是這樣還是存在很多例如 TP53 和 小鼠的Trp53直接轉(zhuǎn)換后不對應(yīng)的問題。
于是考慮到要同源轉(zhuǎn)換。但是看了很多教程,看完了還是干著急不能用。
自己根據(jù)之前的經(jīng)驗結(jié)合一個小的文件,

參考官網(wǎng)
mouse_human_genes = read.csv("http://www.informatics.jax.org/downloads/reports/HOM_MouseHumanSequence.rpt",sep="\t")
這個鏈接應(yīng)該是我在使用biomat的時候報錯,根據(jù)報錯地址獲取的,然后就直接下載了這個文件,保存下來自己用。
下載這個文件后,
下載到其人鼠同源基因文件。內(nèi)容如下:

image.png

所做處理:
提取人鼠的同源基因名,根據(jù)第一列進行匹配,隨后inner_join,得到一個人鼠均有的同源基因文件,如下:


image.png

放在了代碼里了無套路自取,請給本文點個贊
內(nèi)有鼠對人一對多,和人對鼠一對多的情況出現(xiàn)。請注意篩選。
使用方法如下:

輸入數(shù)據(jù)是你的gene  向量
Reference <- read.csv('https://picgo-yxy.oss-cn-guangzhou.aliyuncs.com/img/mouse_human_gene_match.csv')
human→mouse
hmtran <- function(tmpdat){
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$Symbol[match(tmpdat$gene,Reference$SYMBOL)]
  tmpdat <- na.omit(tmpdat)
  return(tmpdat)
}
tmpgene = 你的基因向量
tmpgene = hmtran(tmpgene)

mouse→human
mhtran <- function(tmpdat){
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$SYMBOL[match(tmpdat$gene,Reference$Symbol)]
  tmpdat <- na.omit(tmpdat)
  return(tmpdat)
}
——————————————————————————————————————
2.0版本
Reference <- read.csv('https://picgo-yxy.oss-cn-guangzhou.aliyuncs.com/img/mouse_human_gene_match.csv')
hmtran <- function(tmpdat){
  tmpdat1 = tmpdat
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$Symbol[match(tmpdat$gene,Reference$SYMBOL)]
  tmpdat <- na.omit(tmpdat)
  n = length(setdiff(tmpdat1,tmpdat$gene))
  a = signif(n/length(tmpdat1),3)
  tmp = paste(c(setdiff(tmpdat1,tmpdat$gene)),collapse = ' ')
  print(paste0('There are ',a,'% genes fail to trans. They are |||',tmp))
  return(tmpdat)
}
會顯示有多少基因沒被轉(zhuǎn)換到,心里有個數(shù)吧算是。

阿里云好像是根據(jù)流量收費的,我不想交錢,苦逼碩士沒有錢,所以大家可以從下面下載,其實從上面的代碼直接讀進R里面也可,但是還是計流量,誒,我這估計也不會有很多人看,應(yīng)該不用很貴。
文件這里也有一份,以前寫的一份教程。
https://www.yuque.com/wuwuyuyu/kb/opzg6n?singleDoc# 《人鼠基因名轉(zhuǎn)化——同源轉(zhuǎn)化》
之前寫的很多都在里面,但是垃圾yvque,現(xiàn)在不讓免費公開了,煩死了。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容