TCGA條碼

簡(jiǎn)介

條碼(Barcode)是TCGA納入的每一個(gè)標(biāo)本的專有標(biāo)識(shí)符。

條碼結(jié)構(gòu)

條碼結(jié)構(gòu)
條碼各部分的含義

編制流程

理解條碼的編制流程(見(jiàn)下圖),有助于我們更好的解讀條碼。?

Barcode編制流程圖

簡(jiǎn)而言之,編碼機(jī)構(gòu)BRS(Biospeciman Core Resource)根據(jù)來(lái)源機(jī)構(gòu)(Tissue Source Site,TSS)和捐獻(xiàn)者(Participation),給予編號(hào)TCGA-02 和 TCGA-02-0001,根據(jù)組織類型(Sample)如癌組織、正常組織等,編為T(mén)CGA-02-0001-01(01-09為癌組織,10-14為正常組織,組織類型編碼詳見(jiàn)https://gdc.cancer.gov/resources-tcga-users/tcga-code-tables/sample-type-codes)。同一種組織的標(biāo)本又會(huì)被分裝進(jìn)不同容器(Vial),同一容器內(nèi)又可分為多個(gè)小份(Portion),進(jìn)一步編為 TCGA-02-0001-01B和TCGA-02-0001-01B-02。樣品送至檢測(cè)機(jī)構(gòu)后,制備成不同的分析物(Analyte)檢測(cè),用不同字母編碼,例如D表示DNA,R表示RNA。同一份分析物在檢測(cè)過(guò)程中被加到檢測(cè)板的某一加樣孔中,分別編號(hào) TCGA-02-0001-01B-02D-0182和TCGA-02-0001-01B-02D-0182-06。

組織類型編碼
分析物編碼

應(yīng)用

以上大致介紹了TCGA條碼包含的信息。其中我們最為關(guān)注實(shí)際上是來(lái)自不同捐獻(xiàn)者的組織類型,往往決定分組,例如根據(jù)捐獻(xiàn)者種族分為亞裔和非亞裔,根據(jù)組織類型分為腫瘤組、正常對(duì)照組。

代碼舉例:

num<-as.numeric(substring(id,14,15))  #截取字符串后轉(zhuǎn)為數(shù)字
group_list=ifelse(num%in%1:9,”Tumor”,”Normal”)  #ifelse實(shí)現(xiàn)分組
?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容