導(dǎo)讀
火山圖可以展示cancer vs normal的差異結(jié)果。如果還有一組model組,那么該如何展示呢?使用雙火山圖,實(shí)現(xiàn)了將cancer、normal、model三個(gè)實(shí)驗(yàn)條件繪制在一張圖上,同時(shí)展示cancer vs normal, model vs cancer共有且具有相同差異表達(dá)趨勢(shì)(上調(diào)、上調(diào)),或者相反差異表達(dá)趨勢(shì)(上調(diào)、下調(diào))的感興趣基因。
火山圖
火山圖本質(zhì)上是一種散點(diǎn)圖,它將統(tǒng)計(jì)測(cè)試中的統(tǒng)計(jì)顯著性量度(如p值)和變化幅度(fold change)相結(jié)合,從而能夠幫助研究者快速直觀地識(shí)別那些變化幅度較大且具有統(tǒng)計(jì)學(xué)意義的數(shù)據(jù)點(diǎn)(如基因等)?;鹕綀D常用于轉(zhuǎn)錄組研究,也能應(yīng)用于基因組、蛋白質(zhì)組、代謝組等統(tǒng)計(jì)數(shù)據(jù)。

圖中的點(diǎn)表示基因。
X軸是差異倍數(shù),log2轉(zhuǎn)化。表示基因表達(dá)的倍數(shù)變化,通常以|fc|>=2(即|log2fc|>=1)作為閾值。以左側(cè)和右側(cè)的兩條垂直線(xiàn)表示。
Y軸是P-value,-log10轉(zhuǎn)化。表示統(tǒng)計(jì)檢驗(yàn)獲得的是否統(tǒng)計(jì)差異顯著的一個(gè)衡量值,通常以P-value<0.05?(或者校正p值<0.05)為統(tǒng)計(jì)檢驗(yàn)顯著閾值。以水平線(xiàn)表示,水平線(xiàn)上方的點(diǎn)表示p<0.05,下方的點(diǎn)表示p>0.05。
根據(jù)閾值,將數(shù)據(jù)點(diǎn)分成三類(lèi):
上調(diào)基因,滿(mǎn)足p<0.05 & log2fc>=1,圖中紅色點(diǎn)
下調(diào)基因,滿(mǎn)足p<0.05 & log2fc<=-1,圖中藍(lán)色點(diǎn)
不顯著基因,其他不滿(mǎn)足上調(diào)、下調(diào)閾值的基因,圖中灰色點(diǎn)
雙火山圖
對(duì)于有三個(gè)條件的實(shí)驗(yàn)設(shè)計(jì),一般會(huì)進(jìn)行兩個(gè)比較,這時(shí)使用雙火山圖既可以展示兩個(gè)比較的差異,又可以將兩個(gè)比較中共有的感興趣基因在中間標(biāo)注。相當(dāng)于兩個(gè)火山圖加一個(gè)venn圖。

圖中左側(cè)為cancer vs normal的火山圖。左邊藍(lán)色是下調(diào),右邊紅色是上調(diào)。
右側(cè)為model vs cancer的火山圖。左邊藍(lán)色是下調(diào),右邊紅色是上調(diào)。中間為兩個(gè)比較中感興趣的共有基因,這些基因符合上調(diào)-下調(diào)趨勢(shì)。
此圖在設(shè)計(jì)的時(shí)候,左側(cè)火山圖固定,即:左邊是下調(diào),右邊是上調(diào)。右側(cè)火山圖根據(jù)數(shù)據(jù)左右可以互換,即:可以將上調(diào)畫(huà)在左邊(標(biāo)注上調(diào)+上調(diào)的基因),也可以將下調(diào)畫(huà)在左邊(標(biāo)注上調(diào)+下調(diào)的基因)。這樣可以保證基因的連線(xiàn)在圖中間,而不跨過(guò)不顯著區(qū)域(當(dāng)然也可以繪制跨不顯著區(qū)域的圖)。
除了同時(shí)展示轉(zhuǎn)錄組的兩個(gè)比較結(jié)果外,也可以同時(shí)展示兩種組學(xué),例如cancer vs normal的轉(zhuǎn)錄組,cancer vs normal的蛋白組結(jié)果,標(biāo)注那些基因和蛋白同時(shí)表達(dá)差異的數(shù)據(jù)點(diǎn)。
1,打開(kāi)繪圖頁(yè)面
https://www.bioinformatics.com.cn/plot_basic_label_genes_linked_two_volcano_plot_237

2,示例數(shù)據(jù)
點(diǎn)擊圖片上方的示例數(shù)據(jù),下載,并使用excel打開(kāi)。

示例數(shù)據(jù)包括三部分:
第一部分:左側(cè)火山圖數(shù)據(jù),3列。第一列為基因名(不能有重復(fù)),第二列為log2fc,第三列為p值
第二部分:右側(cè)火山圖數(shù)據(jù),3列。第一列為基因名(不能有重復(fù)),第二列為log2fc,第三列為p值
第三部分:待標(biāo)注基因,必需在左右兩側(cè)火山圖中都出現(xiàn)。
注意:兩部分火山圖行數(shù)可以一樣(例如都是轉(zhuǎn)錄組),也可以不一樣(例如左邊是轉(zhuǎn)錄組右邊是蛋白組)。
3,輸入檢查
Ctrl+A選中示例數(shù)據(jù),Ctrl+C拷貝,Ctrl+V粘貼到輸入框。

然后使用輸入框下面的“輸入檢查”按鈕先對(duì)輸入數(shù)據(jù)進(jìn)行檢查。若檢查不通過(guò),請(qǐng)根據(jù)檢查提示重復(fù)【修改-輸入檢查】步驟,直到檢查通過(guò)(如下圖所示),然后可以繼續(xù)往下進(jìn)行。

注:輸入檢查是新加功能,它會(huì)根據(jù)不同模塊的輸入要求,逐行逐列檢查輸入數(shù)據(jù),并給出提示,確保數(shù)據(jù)符合模塊要求。
4,參數(shù)選擇
圖片大小:圖片寬度,圖片高度
閾值:左側(cè)火山圖的fc、p閾值;右側(cè)火山圖的fc、p閾值。
顏色:上調(diào)顏色,下調(diào)顏色,不顯著顏色,以及標(biāo)注基因的顏色
X軸標(biāo)注:左側(cè)火山圖X軸標(biāo)注比較方式,右側(cè)火山圖X軸標(biāo)注比較方式
P值極值:左側(cè)火山圖p值極值處理方法,右側(cè)火山圖p值極值處理方法。建議相同組學(xué)的用一樣的閾值,不同組學(xué)的使用不一樣的值。
Y軸最大值:用于避免極值點(diǎn)被截?cái)?,可以適當(dāng)增加該值
中間區(qū)域:中間區(qū)域的寬度,默認(rèn)1.2,為火山圖的約1/5寬度;標(biāo)注基因最低位置是基因最下面的位置,若基因較少,可以適當(dāng)增加該值。
字體大小:包括軸說(shuō)明字體大小,刻度字體大小,標(biāo)注基因字體大小,圖例字體大小等
字體:Times New Roman和Arial字體

5,提交出圖
檢查通過(guò),并且參數(shù)選好后,點(diǎn)擊“提交”按鈕,約10s后,會(huì)在頁(yè)面上呈現(xiàn)雙火山圖預(yù)覽。我們提供了pdf,svg兩種矢量圖,png,tiff兩種標(biāo)量圖供大家下載使用。其中矢量圖可以使用acrobat illustrator進(jìn)行編輯、組圖等。

每張圖都是一個(gè)故事,表達(dá)一個(gè)生物學(xué)意義。
在這張圖中,我們可以很清楚地看到在cancer vs normal中,794個(gè)基因表達(dá)上調(diào)1314個(gè)基因表達(dá)下調(diào),在model vs cancer種,1037個(gè)基因表達(dá)上調(diào),607個(gè)基因表達(dá)下調(diào),其中23個(gè)感興趣的基因符合normal-cancer-model的上調(diào)-下調(diào)表達(dá)趨勢(shì)。
參考文獻(xiàn):Liver-Inspired PolyetherketoneketoneScaffolds Simulate Regenerative Signals and Mobilize Anti-Inflammatory Reservesto Reprogram Macrophage Metabolism for Boosted Osteoporotic Osseointegration.Fig4A
微生信助力高分文章,用戶(hù)196000,谷歌學(xué)術(shù)3600