簡(jiǎn)介
條碼(Barcode)是TCGA納入的每一個(gè)標(biāo)本的專有標(biāo)識(shí)符。
條碼結(jié)構(gòu)


編制流程
理解條碼的編制流程(見(jiàn)下圖),有助于我們更好的解讀條碼。?

簡(jiǎn)而言之,編碼機(jī)構(gòu)BRS(Biospeciman Core Resource)根據(jù)來(lái)源機(jī)構(gòu)(Tissue Source Site,TSS)和捐獻(xiàn)者(Participation),給予編號(hào)TCGA-02 和 TCGA-02-0001,根據(jù)組織類型(Sample)如癌組織、正常組織等,編為T(mén)CGA-02-0001-01(01-09為癌組織,10-14為正常組織,組織類型編碼詳見(jiàn)https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/sample-type-codes)。同一種組織的標(biāo)本又會(huì)被分裝進(jìn)不同容器(Vial),同一容器內(nèi)又可分為多個(gè)小份(Portion),進(jìn)一步編為 TCGA-02-0001-01B和TCGA-02-0001-01B-02。樣品送至檢測(cè)機(jī)構(gòu)后,制備成不同的分析物(Analyte)檢測(cè),用不同字母編碼,例如D表示DNA,R表示RNA。同一份分析物在檢測(cè)過(guò)程中被加到檢測(cè)板的某一加樣孔中,分別編號(hào) TCGA-02-0001-01B-02D-0182和TCGA-02-0001-01B-02D-0182-06。


應(yīng)用
以上大致介紹了TCGA條碼包含的信息。其中我們最為關(guān)注實(shí)際上是來(lái)自不同捐獻(xiàn)者的組織類型,往往決定分組,例如根據(jù)捐獻(xiàn)者種族分為亞裔和非亞裔,根據(jù)組織類型分為腫瘤組、正常對(duì)照組。
代碼舉例:
num<-as.numeric(substring(id,14,15)) #截取字符串后轉(zhuǎn)為數(shù)字
group_list=ifelse(num%in%1:9,”Tumor”,”Normal”) #ifelse實(shí)現(xiàn)分組