復(fù)現(xiàn)CELL文章圖片,在線繪制scRNA-seq多個cluster的差異火山圖

導(dǎo)讀

火山圖表示兩組間的差異,而在scRNA-seq中,同時會有多個cluster(vs其他cluster)的差異。如果用常規(guī)火山圖展示,可能需要繪制十幾個圖。有沒有更高效的展示方法呢?今天給大家?guī)鞢ELL文章“A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing Human Heart”中展示scRNA-seq差異基因的多組火山圖的繪制方法。

?1,常規(guī)火山圖

在RNA-seq(或蛋白質(zhì)組,或代謝組)數(shù)據(jù)分析中,火山圖是常見的一種數(shù)據(jù)可視化工具,它通過將統(tǒng)計顯著性量度(如p值)和變化幅度(例如log2FC)相結(jié)合,幫助研究者快速直觀地識別出在不同樣本間具有顯著差異表達的基因(或蛋白,或代謝物)。

火山圖本質(zhì)上是一種散點圖,每個點代表一個基因(或蛋白,或代謝物),其位置由兩個坐標軸定義:橫軸通常表示變化幅度(如log2 fold change,log2FC),縱軸表示統(tǒng)計顯著性(如-log10 p-value)。倍數(shù)變化(fold change)是衡量基因(或蛋白,或代謝物)在一組樣本中相對于另一組樣本的表達水平變化的指標。如果log2FC大于0,則表示基因在實驗組中的表達量上升;如果log2FC小于0,則表示表達量下降。

火山圖可以展示為不同顏色的點,通常紅色表示上調(diào)基因,藍色表示下調(diào)基因,而灰色表示無顯著差異的基因。

2,scRNA-seq火山圖

2019年發(fā)表在CELL上的文章“A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing Human Heart”fig 2h給我們展示了單細胞RNA測序數(shù)據(jù)展示的新思路。

圖中展示了10個cluster的差異基因。其中X軸利用10個矩形塊(編號0-9)將整個區(qū)域分成10快:cluster0 - cluster9。每一塊中X軸上的點進行了抖動(jitter,隨機抖動),Y軸表示logFC,并標注了每個cluster上topN的基因。紅色點表示adjusted

pval<0.01,黑色點表示adjusted pval>0.01。從圖中可以很容易地觀察到每個cluster(vs其他cluster)的差異基因,倍數(shù)變化范圍,大概的差異基因數(shù),以及adjusted pval的情況。令人耳目一新。

3,余丁解圖

所有的圖都是由點、線、顏色等組成的。這個圖由以下元素構(gòu)成:

1),表示基因的點,每個點的位置由X軸cluster的編號和Y軸logFC組成,并且在X軸的方向上進行了jitter;每個點根據(jù)adjusted

pval的大小以不同的顏色表示,可以使用geom_jitter繪制;

2),0-9的cluster,就是10個矩形,標注了不同cluster的編號,可以使用geom_tile函數(shù)繪制

3),限制不同cluster的灰色矩形背景,可以使用geom_col函數(shù)繪制。

由于jitter的點是隨機抖動的,所以如何標注jitter后基因的位置是本圖的難點,這也是網(wǎng)上其他教程懸而未決的問題。

4,在線繪制scRNA-seq多組火山圖

4.1 打開微生信在線作圖網(wǎng)站

https://bioinformatics.com.cn/plot_basic_scrna_multi_volcano_plot_244

4.2? 示例數(shù)據(jù)

點擊右側(cè)的示例數(shù)據(jù),下載打開。

示例數(shù)據(jù)包括四列,A列是基因,B列是log2FC,C列是pvalue,D列是cluster。

4.3 粘貼示例數(shù)據(jù)

拷貝ABCD 4列,粘貼到第一個輸入框。若數(shù)據(jù)較多,也可以上傳tab分割的txt文件。

4.4 設(shè)置參數(shù)

可選參數(shù)我們設(shè)置了

1)標注基因的輸入框

若留空則標注log2FC top10的差異基因;若有數(shù)據(jù)(數(shù)據(jù)為上述表格中感興趣基因所在的行)。

2)圖片大小、字體、cluster背景顏色及透明度

3)cluster矩形的顏色

共設(shè)置了12種可選顏色,第13+種使用系統(tǒng)默認的顏色

4)p/fdr閾值和log2fc閾值

其中p閾值也可以使用科學(xué)計數(shù)法表示。

Log2fc閾值用來控制cluster矩形的高度。因為我們一般不繪制非差異的點(基因)。

5)繪圖模式及顏色

提供了3種繪圖模式。

第一種是up,down模式。Up一種顏色,down一種顏色。

第二種是p模式,p小于閾值的一種顏色,p大于閾值的一種顏色。

第三種是組合模式,up一種顏色,down一種顏色,p小于閾值的一種顏色。

同時提供了點大小、Y軸說明和字體等參數(shù)供選擇。

4.5 提交出圖

粘貼好數(shù)據(jù),選擇好參數(shù)后,點擊提交按鈕,等待約5s后會生成scRNA-seq多組火山圖。

從圖中C3最上方標注的點可以看出,微生信完美解決了網(wǎng)上其他教程中“線指虛空”的問題。

我們提供了PDF、SVG兩種矢量圖,PNG和tiff兩種標量圖供大家下載使用。其中矢量圖可以使用acrobat illustruator或者inkscape進行編輯,例如拖動legend的位置等。

微生信助力高分文章,用戶183000,谷歌學(xué)術(shù)3400

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容