前面給大家簡(jiǎn)單介紹了
今天我們來(lái)給大家來(lái)個(gè)實(shí)戰(zhàn),相信大家經(jīng)常會(huì)在文章里面看到下面這樣的圖。這就是一張典型的蜜蜂圖,不過(guò)技術(shù)含量要更高一些。這張圖其實(shí)包含了三個(gè)技術(shù)要點(diǎn)
1)蜜蜂圖
2)分位線
3)統(tǒng)計(jì)檢驗(yàn)p值,或者顯著性。我們前面也講過(guò)怎么樣將p值轉(zhuǎn)換成相應(yīng)的星號(hào)來(lái)表示統(tǒng)計(jì)顯著性。

1. 數(shù)據(jù)來(lái)源
這張圖里面用到的數(shù)據(jù)來(lái)自TCGA,這個(gè)數(shù)據(jù)庫(kù)做腫瘤研究的小伙伴應(yīng)該很熟悉了。還不了解的小伙伴可以參考
? TCGA數(shù)據(jù)庫(kù)介紹及數(shù)據(jù)挖掘
2. 顏色
根據(jù)樣本類型,我們可以將gene的表達(dá)值分成兩組,Normal組和Tumor組,然后統(tǒng)計(jì)每個(gè)組里面的樣本數(shù),會(huì)顯示在x軸的標(biāo)簽上面。Normal組用藍(lán)色點(diǎn)展示,Tumor組用紅色點(diǎn)展示。
3. 分位線
這個(gè)分位數(shù)線,其實(shí)跟boxplot箱體的上邊沿,下邊沿和中線是一個(gè)概念。分別代表了表達(dá)量的1/4, 中位數(shù)和3/4分位數(shù)。
? m6a甲基化相關(guān)基因boxplot并顯示p值

4. p值或顯著性
這里根據(jù)樣本類型將gene的表達(dá)值分成兩組之后就可以做統(tǒng)計(jì)檢驗(yàn)了,一般可以做t檢驗(yàn),或者做wilcox.test(不滿足正太分布)。然后我們可以根據(jù)需要顯示p值,或者顯示星號(hào)。
這里我們用TCGA數(shù)據(jù)庫(kù)里面的LUAD(肺腺癌的)FABP4基因?yàn)槔?/p>
最終我們得到下面的兩張圖
1)顯示p值

2)顯示顯著性星號(hào)

完整R代碼+詳細(xì)注釋。同時(shí)提供兩個(gè)代碼,一個(gè)針對(duì)TCGA數(shù)據(jù),一個(gè)為通用代碼。???