TCGA數(shù)據(jù)庫下載數(shù)據(jù)整理(二)

? 昨天講解了將Esymbolid文件放在一個文件夾里全部解壓縮,今天我們要講的是,將樣本名稱和樣本的表達量一一對應,構建成我們提到過的那個矩陣。

這里需要medata文件,里面包含所有樣本的樣本名稱,我們要將所有的樣本名稱和每一個Esymbolid里面的每一個樣本的基因表達量一一對應起來。

? 要執(zhí)行這個操作,需要用到一個腳本文件,就是這個腳本文件,

? 如果大家需要的話,可以在科研風雨路的后臺留言,我們發(fā)給您。

接下來就是具體的操作過程,打開昨天我們創(chuàng)建的files文件夾,將這兩個文件merge.pl和medata文件復制到files文件夾里,

調用perl:在搜索框中輸入cmd,點擊命令提示符,

? 輸入cd加空格,加復制黏貼files文件夾的路徑,按回車,接下來輸入perl加空格,加復制黏貼腳本名稱,加空格,同時將medata文件名復制黏貼,上圖,然后按回車,等光標回到大于號后,我已經運行過了,所以就沒有按回車了。

然后點擊gdc文件夾,就可以看到一個matrix文件夾了,里面就是按我們要求轉換好的矩陣了。打開以后如下圖所示。

? 大家先學習一下,如果有看不懂的地方,可以在后臺留言,我們會一一給予解答的,明天我們還會出一期視頻,來幫助大家掌握這個操作過程。如果覺得這個視頻對你們有用的話,歡迎關注,點贊和分享,讓更多的人看見,謝謝大家。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容