國家基因庫生命大數(shù)據(jù)平臺(CNGBdb)的基因組數(shù)據(jù)庫初探

網(wǎng)站主頁

國家基因庫生命大數(shù)據(jù)平臺(CNGBdb)是一個為科研社區(qū)提供生物大數(shù)據(jù)共享和應(yīng)用服務(wù)的統(tǒng)一平臺。本質(zhì)是我國組建的一個類似于NCBI存儲分子數(shù)據(jù)的數(shù)據(jù)庫。前身是深圳華大生命科學(xué)研究院(原深圳華大基因研究院)的深圳國家基因庫。2018年10月在深圳召開第十三屆國際基因組學(xué)大會(“ICG-13”),開幕式上深圳國家基因庫正式發(fā)布了“國家基因庫生命大數(shù)據(jù)平臺(CNGBdb)”。

該數(shù)據(jù)庫為面向世界的開放平臺,但擁有全中文界面(可以設(shè)置為英文),對初學(xué)者較為友好。

網(wǎng)站資源

平臺資源包括文獻(xiàn)、基因、變異等十類。目前樣本庫與組裝庫較為好用。在這兩個庫中可以將上傳至本庫與NCBI的數(shù)據(jù)過濾開,而在基因、序列等庫中,基本是接入NCBI或INSDC,若有直接上傳的也沒有過濾的通道,這就導(dǎo)致若用戶上傳raw數(shù)據(jù)至實驗庫,或分子標(biāo)記至序列庫就將與NCBI的數(shù)據(jù)混淆起來。解決方法是在樣本庫中輸入感興趣的研究對象(Organism),能找到相關(guān)研究的項目編號、樣本編號、實驗編號、測序信息、原始數(shù)據(jù)(fastq文件)及對應(yīng)的超鏈接,組裝庫中可以搜索到注釋了的全基因組。這樣基本能獲取CNGB的獨家資源。但望日后其他庫也能多一些過濾或檢索條件,以便更快捷的從這一國內(nèi)生物信息巨制中獲取有用數(shù)據(jù)。

組裝庫中黃色區(qū)域是設(shè)置數(shù)據(jù)來源的filter
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容