人鼠基因轉(zhuǎn)換

背景: 由于人和小鼠研究進(jìn)展差異,人類基因功能/注釋研究會更加深入,一些數(shù)據(jù)庫只有人的注釋。又或者研究中通常采用小鼠模型進(jìn)行驗證,這種情況下就會涉及一些基因 name / id 轉(zhuǎn)換。

下面就介紹下一般基因轉(zhuǎn)換方式,概括如下:

特殊基因 id/name 轉(zhuǎn)換: R包(biomaRt)

全基因組 id/name 轉(zhuǎn)換: 從Ensembl中直接下載對應(yīng)關(guān)系文件并進(jìn)行轉(zhuǎn)換

另一個有意思的R包(模式物種基因各大數(shù)據(jù)庫注釋查詢):? AnnotationDbi?

同源基因數(shù)據(jù)庫列表:?List of orthology databases

1. 基于R包(biomaRt)

安裝biomaRt包:

library("BiocManager")

BiocManager::install("biomaRt")

library("biomaRt")

listMarts()

##? ? ? ? ? ? ? biomart? ? ? ? ? ? ? ? version

##1 ENSEMBL_MART_ENSEMBL? ? ? Ensembl Genes 106

##2? ENSEMBL_MART_MOUSE? ? ? Mouse strains 106

##3? ? ENSEMBL_MART_SNP? Ensembl Variation 106

##4 ENSEMBL_MART_FUNCGEN Ensembl Regulation 106


小鼠基因轉(zhuǎn)人類基因:

library("biomaRt")

human = useEnsembl(biomart="ensembl", dataset = "hsapiens_gene_ensembl")

mouse = useEnsembl(biomart="ensembl", dataset = "mmusculus_gene_ensembl")

# Basic function to convert mouse to human gene names

convertMouseGeneList <- function(x){

? genesV2 = getLDS(attributes = c("mgi_symbol"), filters = "mgi_symbol", values = x , mart = mouse, attributesL = c("hgnc_symbol"), martL = human, uniqueRows=T)

? humanx <- unique(genesV2[, 2])

? # Print the first 6 genes found to the screen

? return(humanx)

}

musGenes <- c("Hmmr", "Tlx3", "Cpeb4")

convertMouseGeneList(musGenes)

## 測試

musGenes <- c("Hmmr", "Tlx3", "Cpeb4")

convertMouseGeneList(musGenes)

## [1] "HMMR" "CPEB4" "TLX3"

#將代轉(zhuǎn)換基因放在文件中,并讀取

mmu_genes =? read.table("Gene.mmu",header = TRUE,sep= "\t")

head(mmu_genes$Gene)

## [1] "Xkr4"? ? "Gm1992"? "Gm19938" "Rp1"? ? "Sox17"? "Gm37587"

報錯:

##Error: biomaRt has encountered an unexpected server error.

##Consider trying one of the Ensembl mirrors (for more details look at ?useEnsembl)

人類基因轉(zhuǎn)小鼠基因:

hsa = read.table("hsa.raw",header = TRUE,sep= "\t")

head(hsa)

##? ? Gene

##1? ? Xkr4

##2? Gm1992

convertHumanGeneList <- function(x){

? genesV2 = getLDS(attributes = c("hgnc_symbol"), filters = "hgnc_symbol", values = x , mart = human,? ? ? ? attributesL = c("mgi_symbol"), martL = mouse, uniqueRows=T)

? humanx <- unique(genesV2[, 2])

? # Print the first 6 genes found to the screen

? return(humanx)

}

humGenes <-hsa$Gene

convertHumanGeneList(humGenes)

## Error: biomaRt has encountered an unexpected server error.

##Consider trying one of the Ensembl mirrors (for more details look at ?useEnsembl)

經(jīng)過上述嘗試發(fā)現(xiàn),輸入部分基因 name list 轉(zhuǎn)換可以很好的完成;拿全部基因組的gene name做轉(zhuǎn)換還是會出現(xiàn)問題,具體討論解決方案可見: 鏈接

2.?從Ensembl中直接下載對應(yīng)關(guān)系文件并進(jìn)行轉(zhuǎn)換

Step1:Enaembl 官網(wǎng)->BioMart; 選擇對應(yīng)基因組 : 鏈接

Step2: 屬性中選擇“Homologues”: Gene stable ID, Gene name ;

Step3:選擇對應(yīng)orthologs的物種(根據(jù)首字母)

Step4: 下載: Result -> Go


Step5: 查看下載結(jié)果,寫腳本自己轉(zhuǎn)換吧;

? ? 轉(zhuǎn)換結(jié)果:小鼠原始gene 數(shù)目:24784

? ? ? ? ? ? ? ? ? ? 轉(zhuǎn)換后gene數(shù)目:16412

3.??其他

另外,發(fā)現(xiàn)了一個比較有意思的R包,對于探索基因功能注釋以及富集分析會有幫助:AnnotationDbi , org.Hs.eg.db;

安裝:

Library(BiocManager)

BiocManager::install("Orthology.eg.db")

keytypes(org.Hs.eg.db)? ? ##查看基因注釋數(shù)據(jù)庫

## [1] "ACCNUM"? ? ? "ALIAS"? ? ? ? "ENSEMBL"? ? ? "ENSEMBLPROT"? "ENSEMBLTRANS"

## [6] "ENTREZID"? ? "ENZYME"? ? ? "EVIDENCE"? ? "EVIDENCEALL"? "GENENAME"? ?

## [11] "GO"? ? ? ? ? "GOALL"? ? ? ? "IPI"? ? ? ? ? "MAP"? ? ? ? ? "OMIM"? ? ? ?

## [16] "ONTOLOGY"? ? "ONTOLOGYALL"? "PATH"? ? ? ? "PFAM"? ? ? ? "PMID"? ? ? ?

## [21] "PROSITE"? ? ? "REFSEQ"? ? ? "SYMBOL"? ? ? "UCSCKG"? ? ? "UNIGENE"? ?

## [26] "UNIPROT"? ?

columns(org.Hs.eg.db)? #查看通用數(shù)據(jù)庫中id注釋

## [1] "ACCNUM"? ? ? "ALIAS"? ? ? ? "ENSEMBL"? ? ? "ENSEMBLPROT"? "ENSEMBLTRANS"

## [6] "ENTREZID"? ? "ENZYME"? ? ? "EVIDENCE"? ? "EVIDENCEALL"? "GENENAME"? ?

## [11] "GO"? ? ? ? ? "GOALL"? ? ? ? "IPI"? ? ? ? ? "MAP"? ? ? ? ? "OMIM"? ? ? ?

## [16] "ONTOLOGY"? ? "ONTOLOGYALL"? "PATH"? ? ? ? "PFAM"? ? ? ? "PMID"? ? ? ?

## [21] "PROSITE"? ? ? "REFSEQ"? ? ? "SYMBOL"? ? ? "UCSCKG"? ? ? "UNIGENE"? ?

## [26] "UNIPROT"

實施方案具體搜索哈~

4. 同源基因數(shù)據(jù)庫推薦:鏈接

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容