注意:
數(shù)據(jù)庫的更新及版本對應(yīng)使用
NCBI系列:
NCBI db:ftp://ftp.ncbi.nih.gov/blast/db
NCBI genomes:ftp://ftp.ncbi.nlm.nih.gov/genomes/
Nr:NCBI官方非冗余蛋白數(shù)據(jù)庫,包括PDB, Swiss-Prot, PIR, PRF; 如果要用DNA序列,就是nt庫。
注意:構(gòu)建nr或者nt數(shù)據(jù)庫的子庫(如植物),參考生信技能樹,百邁克基因的Nt/nr數(shù)據(jù)庫拆分。
基因家族和組學系列:
Pfam: 蛋白結(jié)構(gòu)域注釋的分類系統(tǒng)
swiss-prot: 經(jīng)過注釋的蛋白質(zhì)序列數(shù)據(jù)庫,蛋白序列得到實驗的驗證,由歐洲生物信息學研究所(EBI)維護。
Interpro:通過蛋白質(zhì)結(jié)構(gòu)域和功能位點數(shù)據(jù)庫預(yù)測蛋白質(zhì)功能。是EBI開發(fā)的一個集成了蛋白質(zhì)家族、結(jié)構(gòu)域和功能位點的非冗余數(shù)據(jù)庫。Interproscan整合了一些使用最普及的一些數(shù)據(jù)庫,并應(yīng)用于功能未知的蛋白進行Interpro注釋和GO注釋。
KEGG: 代謝通路注釋數(shù)據(jù)庫。
GO: 基因本體論注釋數(shù)據(jù)庫。
生信交流論壇
中文:
生信技能樹、CSDN、博客園、簡書等。
英文:
github:生信軟件下載或者向作者提問,參看issuse。
sourceforge:相當于一個倉庫,部分生信軟件下載。
Biostars:專注于生物信息類的問答。支持關(guān)鍵字搜索,遇到問題先搜索答案,最好不要直接就發(fā)帖詢問,因為很多問題已經(jīng)有詳細的答案了。使用參看公眾號:基因?qū)W苑:生物信息神奇網(wǎng)站系列(四):Biostars
seqanswers:是最早的生物信息論壇。使用參看公眾號:基因?qū)W苑生物信息神奇網(wǎng)站系列(三):Seqanswers
常見物種數(shù)據(jù)庫
擬南芥:TAIR:https://www.arabidopsis.org/
水稻:RICE:http://rice.plantbiology.msu.edu/
茄科:Sol genomic Network:https://solgenomics.net/
番茄:TGRC(Tomato Genetic Resoure Center):https://tgrc.ucdavis.edu/
葫蘆科:CuGenDB:http://cucurbitgenomics.org/
葡萄:Grape 12X:http://www.genoscope.cns.fr/externe/GenomeBrowser/Vitis/
Grape Genome:http://genomes.cribi.unipd.it/grape/index.php
玉米:Maize:https://www.maizegdb.org/
柑橘:Citrus sinensis:http://citrus.hzau.edu.cn/orange/index.php
植物多物種數(shù)據(jù)庫
Phytozome12:https://phytozome.jgi.doe.gov/pz/portal.html(需要注冊賬號才能使用)
Ensemblplants:http://plants.ensembl.org/index.html
Plant Genome Duplication Database:http://chibba.agtec.uga.edu/duplication/index/locus
植物轉(zhuǎn)錄因子數(shù)據(jù)庫:http://planttfdb.cbi.pku.edu.cn/