WGCNA分析--提升轉(zhuǎn)錄組測序文章檔次的利器

現(xiàn)在做轉(zhuǎn)錄組測序,看看差異基因,做做富集分析,再討論下差異基因功能與自己研究性狀或處理之間的關(guān)系,最后加簡單的qPCR驗證,這樣的數(shù)據(jù)發(fā)SCI影響因子越來越低了。必須增加新的分析內(nèi)容才能有所突破。今天給大家介紹一個能給文章增色的分析內(nèi)容--基因共表達網(wǎng)絡(luò)分析(WGCNA),該分析對樣品數(shù)有一定要求,建議不少于15個,不過現(xiàn)在測序便宜了,達到這個數(shù)量已經(jīng)不是難事了。下面就給大家介紹兩篇利用WGCNA分析基因共表達網(wǎng)絡(luò)來提升文章檔次。

文章1:

題目:

Identification of regulatory networks and hub genes controlling soybean seed set and size using RNA sequencing analysis

期刊:Journal of Experimental Botany

IF:5.3

性狀:大豆籽粒大小

實驗材料

大豆籽粒的大小是一個非常重要的農(nóng)藝性狀,直接關(guān)系到大豆產(chǎn)量,找到?jīng)Q定大豆籽粒大小的關(guān)鍵調(diào)控基因?qū)罄m(xù)的分子育種具有重要意義,因此作者,選取了兩個大豆品種做轉(zhuǎn)錄組分析,分別是:大籽粒Wandou 28 (V1),小籽粒Peixian Layanghuang (V2),取樣時期為三個時期:seed set (S1), seed growth (S2), and early seed maturation (S3),其中前兩個時期的取樣部位分別為:Seed pod with whole seed(S1),Whole seed(S2),S3時期取了兩個部位分別為:Seed coat(S3-1),Seed cotyledon(S3-2),兩個品種每個樣品三個生物學重復共24個樣品。下圖為種子發(fā)育不同時期照片以及籽粒大小差異統(tǒng)計結(jié)果:

轉(zhuǎn)錄組分析結(jié)果:

對轉(zhuǎn)錄組分析結(jié)果中每個基因做表達量分析,計算每個基因的表達量FPKM,如果基因的表達量,也就是FPKM值<0.5,認為基因無表達,去除這部分基因。然后,統(tǒng)計每個時期不同品種基因表達量高低的分布圖,大約一半的基因處于低表達水平0.5<=FPKM<=5(下圖A);pca分析發(fā)現(xiàn)樣品按照不同發(fā)育時期聚類在一起,而不是按照不同品種聚類,說明發(fā)育時期是決定基因表達譜的關(guān)鍵因素,而性狀的不同引起的轉(zhuǎn)錄表達差異較?。ㄏ聢DB),下圖C展示的為不同品種,不同發(fā)育時期之間表達基因的韋恩圖,在不同的發(fā)育時期都表達的基因還是占絕大多數(shù):

差異基因分析:

差異基因分析,下圖A按相同發(fā)育時期,不同的品種之間差異比較,下圖B為不同發(fā)育時期之間的差異比較,紅色數(shù)字代表上調(diào)差異基因數(shù)量,黑色代表下調(diào)的差異基因數(shù)量:

差異基因功能注釋分析,主要針對決定籽粒大小的差異基因的比較,也就是上圖A中的差異基因進行功能分析,挑出一些代表基因,看一下他的功能和表達量,例如,V1S1 ?vs V2S1差異比較當中,共找到973個差異基因,其中489個基因上調(diào),484個基因下調(diào),上調(diào)的代表基因的功能及表達量表格如下圖所示,其中有轉(zhuǎn)錄因子,植物荷爾蒙(生長素等),脂肪酸代謝,蛋白激酶活性,類黃酮生物合成等功能相關(guān)的基因,總之挑選與種子果實等發(fā)育生長相關(guān)的基因來展示,其他還有好幾個表格,也是關(guān)于上圖A中不同時期的上調(diào)下調(diào)基因的功能注釋表格,展示類似,我這里就不詳細說明了,感興趣的可以查看原文:

不同發(fā)育時期差異比較:

不同的發(fā)育時期差異基因比較,分別繪制每個發(fā)育時期高表達的基因的熱圖,差異基因很多,作者挑選的都是和發(fā)育相關(guān),或者和重要農(nóng)藝性狀相關(guān)的差異基因做熱圖,例如轉(zhuǎn)錄因子相關(guān)的基因,荷爾蒙相關(guān)的,脂肪酸代謝,淀粉糖代謝等相關(guān)的基因。

WGCNA分析找到調(diào)控籽粒大小的關(guān)鍵hub基因:

首先對所有樣品所有基因的表達量矩陣進行過濾,刪除表達量低的基因(FPKM<0.05),一共有7359個基因用于基因共表達網(wǎng)絡(luò)構(gòu)建,總共分析得到12個共表達基因模塊下圖A(聚類樹每一個枝代表一個基因,下面不同的顏色劃分代表基因所處不同的模塊),其中有4個模塊和種子大小相關(guān)下圖B,例如,lightyellow模塊,所有的V1的不同時期的樣品與這個模塊高度相關(guān),再例如green模塊,有793個基因,不管是V1樣品,還是V2樣品,這個模塊都與S1相關(guān)等等。

4個關(guān)鍵模塊基因共表達網(wǎng)絡(luò)構(gòu)建發(fā)現(xiàn)hub基因:

導出WGCNA共表達網(wǎng)絡(luò)分析結(jié)果,繪制模塊當中基因的表達量熱圖和網(wǎng)絡(luò)圖,左邊熱圖從上到下分別代表:green module(A),darkturquoise module(C),black module(E),lightyellow module(G),右邊網(wǎng)絡(luò)圖分別對應共表達網(wǎng)絡(luò),其中紅顏色標記的為連通性較高的hub基因。通過研究這些hub基因的功能發(fā)現(xiàn):這些網(wǎng)絡(luò)中的關(guān)鍵hub基因,包括MYB家族轉(zhuǎn)錄因子,荷爾蒙(ABA,CK,BA)響應因子,細胞色素P450,BR信號激酶等等,都可能與籽粒的大小相關(guān)。

文章2:

題目:

Global transcriptome and co-expression network analyses reveal cultivar-specific molecular signatures associated with seed development and seed size/weight determination in chickpea analysis

期刊:The Plant Journal

IF:5.7

性狀:鷹嘴豆籽粒大小

實驗材料與方法

這篇文章與上一篇文章思路幾乎一致,只是研究的物種變成了鷹嘴豆。同樣的,也是選取了兩個籽粒大小差異明顯的栽培品種:Himchana 1 (small-seeded) and JGK 3 (large-seeded),取樣時期為每個樣品7個時期S1-S7,分別為授粉后5, 9, 12, 19, 25, 30 and 40 天(day after pollination DAP),還測了一下葉片的轉(zhuǎn)錄組,并取3個生物學重復,共48個樣品。不同發(fā)育時期和種子重量差異結(jié)果如下:

轉(zhuǎn)錄組測序結(jié)果:

利用轉(zhuǎn)錄組測序所有基因以及所有樣品的表達矩陣做樣品間的相關(guān)性分析和PCA聚類分析,從中可以發(fā)現(xiàn),相同的發(fā)育狀態(tài)或者組織聚類在一起,說明他們之間具有較強的相關(guān)性。

差異基因比較分析:

作者主要比較了相同發(fā)育狀態(tài)不同品種之間的轉(zhuǎn)錄組差異比較,差異基因的上下調(diào)數(shù)量和其中轉(zhuǎn)錄因子的數(shù)量圖a,另外還統(tǒng)計差異基因中不同類型轉(zhuǎn)錄因子的數(shù)量展示圖b,圖c為不同時期差異基因的富集結(jié)果,顏色越深說明在該功能上越富集,最后S3時期差異基因在mapman中的Metabolic pathways做了富集分析,可以將差異基因的表達量變化情況展示在通路圖中。

基因共表達網(wǎng)絡(luò)分析

首先作者將不同的樣品按籽粒大小不同品種分開,分別用WGCNA做共表達網(wǎng)絡(luò)分析,其中在Himchana 1樣品中共找到27個模塊(a),在JGK 3樣品中找到21個模塊(b)如下圖所示:

模塊與樣品之間相關(guān)性分析,從而發(fā)現(xiàn)不同發(fā)育時期的特有的基因模塊,這部分也是分開做,圖中顏色越紅的方框?qū)哪K和樣品具有較高的相關(guān)性,左邊一半為Himchana 1中模塊與發(fā)育時期相關(guān)圖,右邊一半為JGK3模塊與發(fā)育時期相關(guān)結(jié)果,然后得到每個樣品中每個時期對應的最相關(guān)的模塊,(如下圖):

結(jié)合上一步的分析結(jié)果,再來分析兩個品種各自得到的模塊之間的相關(guān)性,理論上講,雖然品種不同但是各自品種相同發(fā)育時期的對應的特有模塊應該具有較高的相關(guān)性,例如,在JGK 3樣品中左下角黑色模塊與S6發(fā)育時期相關(guān),通過相關(guān)性分析,這個模塊與Himchana 1中的darkorange相關(guān),正好呢darkorange模塊在Himchana 1 中也與S6相關(guān)(下圖中紅紫色方框);同樣的道理其他很多模塊都有這樣的相關(guān)性(下圖中紅色方框),但是在Himchana 1 中有個orange模塊不與JGK 3中任何一個模塊相關(guān),作者推斷這個特殊的模塊很可能與籽粒大小相關(guān),當然還有其他幾個模塊也有類似的現(xiàn)象。作者進一步研究這些模塊中基因表達情況發(fā)現(xiàn)里面很多基因的表達量(在S3 和 S5時期)在不同的品種中具有相反的表達,之后作者進一步研究這些模塊里面基因的相關(guān)功能等等:

總結(jié):

上述兩篇文章都是植物當中普通的轉(zhuǎn)錄組文章,由于添加了WGCNA分析從另一個角度分析與性狀相關(guān)的基因,文章的檔次提升不少。想得到WGCNA的分析技能嗎,點擊《WGCNA視頻教學視頻》即可觀看:手把手教學包你學會。

更多生物信息課程:

1. 文章越來越難發(fā)?是你沒發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡單快速,學習鏈接:基因家族分析實操課程基因家族文獻思路解讀

2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入?圖表看不懂?點擊鏈接學習深入解讀數(shù)據(jù)結(jié)果文件,學習鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀;轉(zhuǎn)錄組(無參)結(jié)果解讀

3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA,提升你的文章檔次,學習鏈接:WGCNA-加權(quán)基因共表達網(wǎng)絡(luò)分析

4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘?學習鏈接:轉(zhuǎn)錄組標準分析后的數(shù)據(jù)挖掘轉(zhuǎn)錄組文獻解讀

5.?微生物16S/ITS/18S分析原理及結(jié)果解讀、OTU網(wǎng)絡(luò)圖繪制、cytoscape與網(wǎng)絡(luò)圖繪制課程

6. 生物信息入門到精通必修基礎(chǔ)課,學習鏈接:linux系統(tǒng)使用perl入門到精通、perl語言高級、R語言畫圖

7. 醫(yī)學相關(guān)數(shù)據(jù)挖掘課程,不用做實驗也能發(fā)文章,學習鏈接:TCGA-差異基因分析、GEO芯片數(shù)據(jù)挖掘、GSEA富集分析課程、TCGA臨床數(shù)據(jù)生存分析、TCGA-轉(zhuǎn)錄因子分析、TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析

8.其他課程鏈接:二代測序轉(zhuǎn)錄組數(shù)據(jù)自主分析、NCBI數(shù)據(jù)上傳、二代測序數(shù)據(jù)解讀。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容