相信GEO(Gene Expression Omnibus)數(shù)據(jù)庫大家應該都不陌生,小編前面也通過三期視頻詳細的介紹過這個公共數(shù)據(jù)庫,以及如何在GEO里面檢索相關(guān)的數(shù)據(jù)。
?GEO數(shù)據(jù)庫數(shù)據(jù)檢索方法(一)
?GEO數(shù)據(jù)庫數(shù)據(jù)檢索方法(二)
?GEO數(shù)據(jù)庫數(shù)據(jù)頁面介紹(三)
在GEO數(shù)據(jù)庫里面收錄了各種各樣的數(shù)據(jù),不僅有芯片數(shù)據(jù)也有測序數(shù)據(jù)。不僅有DNA數(shù)據(jù),表達譜數(shù)據(jù),也有甲基化數(shù)據(jù)和chip-seq的數(shù)據(jù)。對于表達譜數(shù)據(jù)來說,一般第一步我們都會去做差異表達分析,去尋找在不同狀態(tài)下表達值存在顯著差異的基因,然后基于這些差異表達的基因再去做一些下游的分析。前面小編也給大家介紹過一些基于TCGA做差異表達分析的方法
那么對于GEO里面的芯片數(shù)據(jù),我們也可以通過零代碼的方式和R代碼的方式來分析。今天小編就給大家介紹一下如何使用GEO數(shù)據(jù)庫自帶的工具GEO2R來零代碼做差異表達分析。
1.首先我們打開GEO(https://www.ncbi.nlm.nih.gov/)的網(wǎng)站,通過上面視頻里面講到的方法來檢索自己感興趣的數(shù)據(jù),這里檢索的是黑色素瘤里面敏感還耐藥相關(guān)的數(shù)據(jù)

我們以下面這套數(shù)據(jù)為例

2.設置樣本分組
點擊了Analyze with GEO2R之后就會跳轉(zhuǎn)到下面的頁面,這個時候我們就可以點擊Define groups開始設置分組信息了,先輸入一個sensitive組。

然后再輸入一個resistant組

3.將樣本劃分到相應的分組
按住ctrl,選中三個sensitive的樣本,點擊分組里面的sensitive標簽,這個時候就會顯示這個分組里面有三個樣本

同樣的方法,我們可以選中剩下的四個樣本,點擊resistant標簽

4.點擊Analyze做差異表達分析

5.查看并下載結(jié)果

可以點擊圖片查看火山圖,venn圖,箱形圖等等。
完整的差異表達的結(jié)果可以通過點擊Download full table 獲取。

可能有些小伙伴發(fā)現(xiàn)這個表里面沒有基因的名字,這個就很尷尬了。不要慌,其實在Download full table邊上還有一個Select columns,可以選擇需要包含在表里面的信息

我們可以根據(jù)自己的需求,選擇需要包含的信息,如果勾選symbol就會在最后的表格里面包含基因名字了。選好之后,點擊set就OK了。

下面是更改之后的表格
