【NCBI編號(hào)】NCBI中編號(hào)/編碼說(shuō)明
在日常分析中,我們?cè)贜CBI數(shù)據(jù)中常常見(jiàn)到AC、NC、NM、NR、NP、NG等各類編號(hào),這類編號(hào)分別代表著怎樣的含義?我們?cè)撊绾胃鶕?jù)自己的需求來(lái)選擇正確的編號(hào)呢?
今天就來(lái)說(shuō)一說(shuō)常見(jiàn)的NCBI編號(hào)的意義。
1)AC_***:genomic mixed,一些可供選擇的注釋的基因組序列,主要用來(lái)標(biāo)記病毒和原核生物;
2)AP_***:protein mixed,AC_標(biāo)記序列對(duì)應(yīng)的蛋白產(chǎn)物;
3)NC_***:genomic mixed,完整的基因組分子序列,標(biāo)記的類別包括基因組、染色體、細(xì)胞器、質(zhì)粒;
4)NG_***:genomic mixed,不完整的基因組區(qū)域,提供NCBI基因組注釋途徑。比較有代表性有不轉(zhuǎn)錄的假基因或者哪些很難自行化注釋的基因組簇;
5)NM_***:mRNA mixed,轉(zhuǎn)錄組產(chǎn)物序列;成熟mRNA轉(zhuǎn)錄本序列;
6)NP_***:protein mixed,蛋白產(chǎn)物;主要是全長(zhǎng)轉(zhuǎn)錄氨基酸序列,但也有一些只有部分蛋白質(zhì)的部分氨基酸序列;
7)NR_***:RNA mixed,非編碼的轉(zhuǎn)錄子序列,包括結(jié)構(gòu)RNAs,假基因轉(zhuǎn)子等;
8)NT_***:genomic automated,BAC或者鳥(niǎo)槍測(cè)序法的還未完全注釋的測(cè)序序列;
9)NW_***:genomic automated,BAC或者鳥(niǎo)槍法測(cè)序的還未完全注釋的測(cè)序序列;
10)NZ_ABCD1234***:genomic automated,收集的各種利用鳥(niǎo)槍法測(cè)序的測(cè)序計(jì)劃,ABCD?代表的是計(jì)劃名稱;
11)?XM_***:mRNA automated,轉(zhuǎn)錄產(chǎn)物;mRNA來(lái)自基因組注釋,序列相當(dāng)于基因組重疊群;
12)XP_***:protein automated,蛋白產(chǎn)物;序列相當(dāng)于基因組重疊群;
13)XR:RNA automated,轉(zhuǎn)錄產(chǎn)物;非編碼區(qū)來(lái)自基因組注釋,序列相當(dāng)于基因組重疊群;
14)YP_***:protein mixed,蛋白產(chǎn)物;不涉及到轉(zhuǎn)錄組,主要用來(lái)標(biāo)記細(xì)菌、病毒和線粒體;
15)ZP_***:protein automated,蛋白產(chǎn)物?;主要是用電腦自動(dòng)注釋;
16)NS_***:genomic automated,未知生物分子基因組序列。