1:了解substr函數(shù)(截取函數(shù)),從start位置開始提取字符串,示例如下

2:用substr函數(shù)在TCGA數(shù)據(jù)中提取樣本信息
tumor <- colnames(expr)[as.integer(substr(colnames(expr),14,15)) < 10]
normal <- colnames(expr)[as.integer(substr(colnames(expr),14,15)) >= 10]
根據(jù)TCGA數(shù)據(jù)中14,15位代表樣本性質(zhì)來提取分組信息。通過substr函數(shù),截取表達矩陣中(expr),列名的第14.15的數(shù)值(用as.integer 轉(zhuǎn)變?yōu)檎麛?shù)),然后判斷14,15位置上的數(shù)值,<10(01-09)則為tumor組,>10(11)是指normal組。

因此,通過上述代碼,利用substr函數(shù)即可得到樣本的分組信息。
