訪問NCBI ftp 下載數(shù)據(jù)
https://ftp.ncbi.nlm.nih.gov/
https://ftp.ncbi.nlm.nih.gov/gene/DATA/
gene2ensembl,gene2accession, gene2pubmed,gene2go以及
gene_info信息文件,它們的核心連接是gene的entrez ID號(hào)
人類的:
https://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Mammalia/Homo_sapiens.gene_info.gz
最主要的前幾列
#tax_id #物種編號(hào)9606 是人類
#GeneID 基因ID 最新的;所以用舊的ID 無(wú)法轉(zhuǎn)換,可以嘗試參考中方法或者爬蟲
#Symbol 基因名
#LocusTag 別名
#tax_id GeneID Symbol LocusTag
9606 1 A1BG - A1B|ABG|GAB|HYST2477