WGCNA學(xué)習(xí):WGCNA應(yīng)用場景與實(shí)例解讀

WGCNA筆記第二彈

1.WGCNA應(yīng)用場景

  • 不同組織樣品

  • 時(shí)間序列樣品:生長發(fā)育,脅迫處理

  • 單個(gè)材料:相同處理不同時(shí)間,不同處理相同時(shí)間,不同處理不同時(shí)間

  • 兩個(gè)材料:相同處理不同時(shí)間,不同處理相同時(shí)間,不同處理不同時(shí)間

  • 表型數(shù)據(jù):同級相關(guān)表型的數(shù)據(jù)

2.WGCNA實(shí)驗(yàn)設(shè)計(jì)

  • 1.時(shí)間序列樣品,兩個(gè)材料相同處理,可以一起做WGCNA分析,也可以分別做然后比較,相同材料不同處理之間也一樣

  • 2.同一物種,不同來源的轉(zhuǎn)錄組數(shù)據(jù),可以放在一起做WGCNA,也可以分開來比較

  • 3.一般建議15個(gè)樣品以上進(jìn)行WGCNA分析有生物學(xué)意義,可以使5個(gè)時(shí)間點(diǎn)三個(gè)重復(fù)的15個(gè)樣品

  • 4.表型數(shù)據(jù),建議收集可以統(tǒng)計(jì)量化的性狀數(shù)據(jù),可將模塊和表型數(shù)據(jù)關(guān)聯(lián)分析,有助于篩選關(guān)鍵基因模塊和基因來解釋相關(guān)表型

3.單個(gè)材料案例

Floral Transcriptomes in Woodland Strawberry Uncover Developing Receptacle and Anther Gene Networks

野草莓花器官轉(zhuǎn)錄組解析花發(fā)育中花托和花藥的基因調(diào)控網(wǎng)絡(luò)

3.1方案設(shè)計(jì)

  • 單個(gè)材料不同組織樣品

  • 取材野草莓花器官不同組織

  • 從不同發(fā)育時(shí)期的花器官分離花藥、花粉、心皮、花托等組織,再加上小苗葉片,共17個(gè)組織。每個(gè)組織兩個(gè)重復(fù),共34個(gè)樣本。

3.2 轉(zhuǎn)錄組數(shù)據(jù)整體分析

3.2 鑒定配子體孢子體相關(guān)基因

在不同發(fā)育時(shí)期花藥中共同表達(dá)的基因鑒定為雄性孢子體特異性基因

GO富集顯示,雄性孢子基因集主要為代謝生物學(xué)過程,如小分子、有機(jī)酸、細(xì)胞內(nèi)酮代謝等等

在花粉和小孢子特異表達(dá)的基因中共同表達(dá)的基因鑒定為配子體特異基因

3.3花發(fā)育過程轉(zhuǎn)錄組的時(shí)空表達(dá)模式分析

對所有差異表達(dá)的基因進(jìn)行K-means聚類分析鑒定19個(gè)cluster,呈現(xiàn)出發(fā)育時(shí)期和組織特異性表達(dá)模式,如C1 C22為心皮特異性

進(jìn)一步將19個(gè)cluster合并為10個(gè)supercluster,并進(jìn)行功能富集分析,如心皮特異性的supercluster,并進(jìn)行功能富集分析。如心皮特異性的supercluster1富集的功能為DNA合成。

對cluster中的161個(gè)轉(zhuǎn)錄因子進(jìn)行表達(dá)量聚類分析,也呈現(xiàn)發(fā)育時(shí)期和組織特異性的表達(dá)模式。

3.4 WGCNA構(gòu)建共表達(dá)網(wǎng)絡(luò)

用差異表達(dá)基因進(jìn)行WGCNA分析,鑒定了23個(gè)基因模塊。

用每個(gè)模塊的epigengene值與不同組織樣品進(jìn)行關(guān)聯(lián)分析,鑒定組織緊密關(guān)聯(lián)的基因模塊。

12個(gè)模塊與單一的組織樣品特異性高度相關(guān),如blue模塊與花粉(pollen)特異性相關(guān)。

WGCNA鑒定的組織特異性基因集合與K-means的結(jié)果相符合

WGCNA鑒定的花托特異性模塊(light yellow)和幼嫩花(stage1-4)特異性模塊(dark red),在K-means的cluster中并沒有

3.5 組織特異性表達(dá)模塊

WGCNA鑒定的花托特異性模塊(light yellow)和幼嫩花(stage1-4)特異性模塊,在K-means的cluster中并沒有。

分析了Dark red模塊和Light yellow模塊epigengene在各樣品中的表達(dá)模式

熱圖呈現(xiàn)了Dark red模塊和Light yellow模塊中每個(gè)基因在各個(gè)樣品中的表達(dá)模式

3.6 花托特異性模塊內(nèi)部分析

關(guān)鍵基因(hub gene):模塊內(nèi)網(wǎng)絡(luò)中連接度較多的基因。

關(guān)注模塊中的轉(zhuǎn)錄因子:花托特異性模塊111個(gè)基因中有27個(gè)轉(zhuǎn)錄因子,重點(diǎn)分析這些轉(zhuǎn)錄因子。

大部分hub gene為參與調(diào)控分生組織的轉(zhuǎn)錄因子,如WOX、GRS、NAC等。

hub gene中連接度最高的為GRS轉(zhuǎn)錄因子家族的FveLOM3。擬南芥中三突變體lom1 lom2 lom3表現(xiàn)出分生組織異常的表型。因此FveLOM3可能是花托發(fā)育的關(guān)鍵調(diào)控因子。

此外,高連接度的hub gene還包括一個(gè)B3 domain轉(zhuǎn)錄因子、一個(gè)Myb轉(zhuǎn)錄因子和WUS同源基因

3.7 花藥發(fā)育差異基因分析

stage9花藥中上調(diào)表達(dá)的1453個(gè)基因中,211個(gè)編碼FBX domain蛋白。在野草莓基因組中包含820個(gè)FBX基因。大比例FBX上調(diào)表達(dá)說明在花藥減數(shù)分裂這個(gè)時(shí)期發(fā)生了大量的蛋白降解。

K-means的cluster富集分析中花藥-9的cluster富集的為蛋白降解。

FBX基因表達(dá)聚類熱圖分析顯示,大部分FBX只在stage9時(shí)期暫時(shí)高表達(dá),隨后的stage10和11下調(diào)表達(dá)。

在花藥發(fā)育過程中,共296個(gè)FBX基因差異表達(dá),其中6個(gè)亞家族占的比例較大,包括FBD、LRR、DUF295

3.8花藥特異性模塊分析

花藥stage9特異性基因模塊為pink,其中包含了37個(gè)FBX基因。

通過篩選連接度較高的基因來鑒定hub gene。5個(gè)基因的度數(shù)目高于200。

其中4個(gè)基因參與蛋白降解,F(xiàn)-box、WD-repeat

3.8 小結(jié):WGCNA分析思路

實(shí)驗(yàn)方案:單個(gè)材料,不同組織樣品,所有差異表達(dá)基因進(jìn)行WGCNA分析

通過模塊Epigengene值與不同組織樣本進(jìn)行關(guān)聯(lián)分析,鑒定組織特異性模塊

hub基因篩選

連接度較高的基因

重點(diǎn)關(guān)注轉(zhuǎn)錄因子(花托特異性模塊)

前期結(jié)果中的目標(biāo)基因(話要特異性模塊中的FBX)

4.兩個(gè)材料

Global transcriptome and coexpression network analyses reveal cultivara specific molecular signatures associated with seed development and seed size/weight determination in chickpea

4.1方案設(shè)計(jì)

4.2 兩個(gè)鷹嘴豆栽培種的種子發(fā)育表性分析

兩個(gè)鷹嘴豆栽培種Himchana1(小種子,平均100粒種子重量為13.1g)和JGK3(大
種子,平均100粒種子重量為53.3g).
種子發(fā)育的7個(gè)時(shí)間段(S1-S7),分別代表了種子發(fā)育的三個(gè)階段:胚芽發(fā)育(S1-S3)、早期和中期成熟階段(籽粒灌漿,S4-S5)、成熟晚期(種子干燥,S6-S7)

種子的不同發(fā)育階段S1-S7依據(jù)授粉天數(shù)(Day after Pollination,DAP)劃分,5、9.12,19,25、30和40 DAP分別為S1、S2、S3.S4、S5、S6和S7.

表型分析:種子發(fā)育不同時(shí)間點(diǎn)的種子重量和大小的統(tǒng)計(jì)數(shù)據(jù)比較。

4.3 兩個(gè)材料種子發(fā)育過程轉(zhuǎn)錄組的整體解析

為了分析兩個(gè)材料種子發(fā)育過程轉(zhuǎn)錄組動(dòng)態(tài)變化的差異,基于16個(gè)組織樣品所有表達(dá)基因的表達(dá)量的斯皮爾曼相關(guān)系數(shù)(SCC)進(jìn)行層次聚類和主成分分析(PCA)。

兩個(gè)材料中相同發(fā)育時(shí)期組織樣品表現(xiàn)出很高的相關(guān)性。
兩個(gè)材料葉片聚在一起,與所有種子樣品表現(xiàn)出明顯差異。
兩個(gè)材料的S3有差異,JGK3-S3與S2更接近,而HC1-S3與S4更像。這說明HC1在種子發(fā)育早期比JGK3生長發(fā)育得更快。
雖然兩個(gè)材料S5也聚類在一起,但是關(guān)系并沒有其他時(shí)期的緊密,也呈現(xiàn)一定的差異。
因此,S3和S5可能是兩個(gè)材料種子大小和重量差異的關(guān)鍵發(fā)育時(shí)期

4.4 種子發(fā)育過程中差異基因表達(dá)分析

鑒定種子發(fā)育過程中每個(gè)時(shí)期特異表達(dá)的基因

各個(gè)時(shí)期特異表達(dá)的基因數(shù)目差異很大,S2最少,S5最多。
兩個(gè)材料中各自時(shí)期特異表達(dá)的基因數(shù)目也有所不同,HC1在S2最少,JGK3則在S6最少,但是兩者在S5都是最多的。
兩個(gè)材料中均時(shí)期特異表達(dá)的基因比例也不小,表達(dá)量層次聚類分析呈現(xiàn)出明顯的發(fā)育時(shí)期特異性。
說明每個(gè)發(fā)育階段有著自己獨(dú)立的發(fā)育程序。
Go富集分析,主要為生殖過程、細(xì)胞壁組裝、細(xì)胞周期和細(xì)胞分裂、碳代謝等,這些都是已知參與種子發(fā)育的。
有些GOterm在兩個(gè)材料中均富集,有些只在一個(gè)材料中富集。

4.5兩個(gè)材料差異表達(dá)基因分析

定兩個(gè)材料在種子發(fā)育每個(gè)時(shí)期的顯著差異表達(dá)基因集。
HC1 VS JGK3,共有8562個(gè)基因上調(diào)表達(dá),9023個(gè)下調(diào)表達(dá)。
差異基因數(shù)目最多的是S7,其次為S3;最少的為S4。
重點(diǎn)分析了TF,許多TF家族在JGK3中顯著上調(diào)或下調(diào)模式。
GO富集顯示,在JGK3中上調(diào)表達(dá)基因主要富集在一些細(xì)胞分裂相關(guān)term中,尤其在S3中。
代謝通路注釋分析顯示,在S3時(shí)期某些代謝通路呈現(xiàn)顯著的差異。
在JGK3中淀粉代謝和光合作用相關(guān)基因激活表達(dá),細(xì)胞周期和細(xì)胞分裂相關(guān)基因也上調(diào)表達(dá)。
在S3時(shí)期JGK3中細(xì)胞壁合成和修飾的許多基因上調(diào)表達(dá)。

4.6 WGCNA鑒定共表達(dá)基因模塊

WGCNA分別鑒定了HC1的27個(gè)基因模塊和JGK3的21個(gè)基因模塊。
所有模塊中都包含TF,數(shù)量從幾個(gè)到幾百個(gè)不等。
模塊和發(fā)育時(shí)期樣品關(guān)聯(lián)分析(PCC),13個(gè)HC1模塊和6個(gè)JGK3模塊與發(fā)育時(shí)期樣品高度關(guān)聯(lián)(0.6以上)。
許多模塊不僅與一個(gè)發(fā)育時(shí)期關(guān)聯(lián),一些模塊僅與某個(gè)特定發(fā)育時(shí)期樣品關(guān)聯(lián)。如JGK 3的lightyellow模塊與S4高度特異關(guān)聯(lián)(0.93).
模塊的GO富集分析結(jié)果與差異表達(dá)基因分析結(jié)果相一致。如,種子發(fā)育早期相關(guān)模塊主要富集的GO term為細(xì)胞分離、細(xì)胞形態(tài)、細(xì)胞壁組裝、基因表達(dá)調(diào)控。

4.7 兩個(gè)材料的基因模塊保守性分析

鑒定兩個(gè)材料共表達(dá)基因模塊的保守性。
計(jì)算不同模塊中的相同基因數(shù)目,然后通過Fisher精確檢驗(yàn)的P-value值評估顯著性。
兩個(gè)材料中大部分保守模塊關(guān)聯(lián)的是相似的種子發(fā)育時(shí)期樣品。
少部分保守模塊在不同材料中表型不同的發(fā)育時(shí)期關(guān)聯(lián)性和轉(zhuǎn)錄激活時(shí)期。
鑒定了材料特異性模塊,如HC1的3個(gè)模塊(organe-HS4等)和4個(gè)JGK3模塊(如lightgreen-JS4)。
HC1特異性模塊主要富集GO term為轉(zhuǎn)錄調(diào)控、細(xì)胞程序性死亡、衰老等;JGK3特異性模塊富集的為DNA復(fù)制、細(xì)胞分裂、基因表達(dá)、蛋白修飾等。

4.8 種子發(fā)育和種子大小、重量相關(guān)轉(zhuǎn)錄調(diào)控模塊分析

目的:鑒定JGK3發(fā)育S3和S5的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)。主要為TFs及其共表達(dá)的靶基因(包含TFs結(jié)合位點(diǎn),motif顯著富集分析)

候選模塊:HC1和JGK3中與S3、S5時(shí)期相關(guān)的共表達(dá)基因模塊

JGK3的S3時(shí)期相關(guān)模塊brown轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò):顯著富集的DNA motifs有ATHB1、JASE1等,相關(guān)的TFs有woX9、PDF2、RLT2等,以及靶基因相關(guān)的GO term,基因表達(dá)調(diào)控、細(xì)胞壁組裝、表達(dá)大小調(diào)控等。

比較JS3和HS3模塊轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò),大部分組分是相同的,但是也有一些材料特異性的組分。

同樣也分析了JS5和HS5相關(guān)模塊轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)組分,包括DNA motifs、TFs,以及GO term。

JS5和HS5的調(diào)控網(wǎng)絡(luò)大部分組分是相同的,但是也有一些材料特異性的組分。

該分析鑒定了種子發(fā)育中的關(guān)鍵調(diào)控因子,兩個(gè)材料的調(diào)控相似但不完全一樣。

4.9 種子發(fā)育和種子大小、重量相關(guān)轉(zhuǎn)錄調(diào)控模塊分析

一些基因模塊在兩個(gè)材料的S3和S5時(shí)期表現(xiàn)出相反表達(dá)模式。

主要有3類:HS3下調(diào)JS3上調(diào),HS3上調(diào)JS3下調(diào),HS5下調(diào)JS5上調(diào)。

這些模塊可能與兩個(gè)材料種子發(fā)育不同相關(guān),進(jìn)行轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)分析。

HJ3上調(diào)JS3下調(diào)轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)鑒定:motifs、TF、GOterms。

S3時(shí)期的top hub基因表達(dá)模式反應(yīng)了這不同模塊中所有基因的表達(dá)模式。

這些網(wǎng)絡(luò)中的許多motifs、TFs都是已知參與調(diào)控種子大小、重量的重要調(diào)控因子。

4.10 小結(jié)

實(shí)驗(yàn)方案:兩個(gè)材料,不同發(fā)育時(shí)期樣品,所有差異表達(dá)基因進(jìn)行WGCNA分析。
兩個(gè)材料分別進(jìn)行WGCNA分析鑒定各自的基因模塊。
通過模塊Epigengene值與不同發(fā)育時(shí)期樣品進(jìn)行關(guān)聯(lián)分析,鑒定時(shí)期特異性模塊,并通過模塊GO功能富集來解析各發(fā)育時(shí)期的調(diào)控機(jī)制。
兩個(gè)材料模塊保守性分析,鑒定保守性和特異性模塊,通過Go富集解析各自表型。
模塊篩選:
依據(jù)前面研究結(jié)果S3和S5兩個(gè)材料差異最大,重點(diǎn)分析這兩個(gè)時(shí)期相關(guān)的基因模塊。
依據(jù)表達(dá)模式篩選在兩個(gè)材料的S3和S5時(shí)期表現(xiàn)出相反表達(dá)模式的模塊。
轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)關(guān)鍵基因篩選:TFs和包含顯著富集motifs的靶基因、top 20/40 hub gene。

5. 表型數(shù)據(jù)

Root Cell-Specific Regulators of Phosphate-Dependent Growth

5.1 PRCE在根部的細(xì)胞特異性表達(dá)驗(yàn)證和T-DNA插入突變體篩選

構(gòu)建了12個(gè)PRCE基因的啟動(dòng)子-GFP轉(zhuǎn)基因line,驗(yàn)證它們是否呈現(xiàn)細(xì)胞特異性表達(dá)模式。
其中10個(gè)基因表現(xiàn)出嚴(yán)格的細(xì)胞類型特異性表達(dá)模式(皮層、中柱鞘、中柱、木質(zhì)部薄壁細(xì)胞等)。
篩選鑒定了11個(gè)PRCE基因的T-DNA插入純合突變體,其中10個(gè)為功能缺失突變體,1個(gè)為功能獲得型突變體。

5.2 突變體表型分析

prce突變體在磷足夠和缺乏條件下,植物根和芽中磷的濃度變化。
prce突變體在磷足夠和缺乏條件下,植物生長情況,根和芽中生物量的變化。
大部分prce突變體表現(xiàn)出明顯不同于野生型(Col-0)的特征,包括所有定量的生理表型。

5.3 prce突變體根中相應(yīng)基因的轉(zhuǎn)錄水平變化

選取以前發(fā)表文獻(xiàn)中的缺磷的兩個(gè)轉(zhuǎn)錄組數(shù)據(jù)集,包含不同的基因型材料,其中Col-0和phr1-1為對照材料。

在兩個(gè)數(shù)據(jù)集中,Col-0的63%和6%的PSR基因在phr1-1中沒有變化;許多野生型PSR基因在prce突變體中呈現(xiàn)出不同的表達(dá)。

在兩個(gè)數(shù)據(jù)集中篩選了Col-0中差異表達(dá)2倍以上的831個(gè)磷響應(yīng)核心基因,進(jìn)步通過層次聚類分析其在不同基因型材料中的表達(dá)模式。并依據(jù)基因表達(dá)模式分析不同基因型樣品之間的關(guān)系。

S6k2突變體表現(xiàn)出與phr1-1類似的缺磷反應(yīng),而wdd1突變體表現(xiàn)出類似Col-0的缺磷反應(yīng)。

5.4 鑒定prce突變體相關(guān)共表達(dá)網(wǎng)絡(luò)

對32個(gè)RNA-seq數(shù)據(jù)集(磷足夠和磷缺乏)的所有表達(dá)轉(zhuǎn)錄本分別進(jìn)行WGCNA分析,都鑒定了18個(gè)共表達(dá)基因模塊。
計(jì)算模塊的特征值(Eigengene),并通過特征值來計(jì)算模塊和生理性狀(數(shù)量性狀,如磷含量和濃度、生物量、根相對生長速率、初根根長等)的相關(guān)性。
重點(diǎn)關(guān)注與性狀顯著相關(guān)的10個(gè)模塊,以及在不同基因型中呈現(xiàn)相反表達(dá)模式的模塊。
缺磷時(shí),yellowf和red模塊與生物量顯著正相關(guān);磷充足時(shí),black模塊與生物量顯著負(fù)相關(guān)。
與生物量呈現(xiàn)相反關(guān)聯(lián)的還有缺磷的green模塊和磷足夠的pink模塊。


5.5 重點(diǎn)模塊和模塊內(nèi)hub基因分析

缺磷的yellow模塊,包含684個(gè)基因,與生物量、磷含量、根芽比例都顯著相關(guān)。其中24%基因與之前轉(zhuǎn)錄組鑒定的PSI基因相一致。

模塊基因,相對野生型,在phr1-1中下調(diào)表達(dá),在prce突變體(cb/1、prce2等)上調(diào)表達(dá)。

篩選與該模塊的ME(kME)排在前300的基因進(jìn)行富集分析,顯著富集的GO term有缺磷相關(guān)、磷脂和半乳糖脂代謝等。

模塊hub gene篩選:kME大于0.9。主要為脂代謝、感知磷、磷信號導(dǎo)、磷運(yùn)輸?shù)认嚓P(guān)基因。

Yellow模塊在cb/1中表現(xiàn)較高的ME值,說明鈣信號通過CBL1影響磷轉(zhuǎn)運(yùn)。進(jìn)一步篩選該模塊中鈣信號相關(guān)基因,重點(diǎn)關(guān)注,作為hub gene候選。

5.6 小結(jié)

實(shí)驗(yàn)方案:兩種處理,不同基因型樣品,所有表達(dá)基因進(jìn)行WGCNA分析。
兩種處理分別進(jìn)行WGCNA分析鑒定各自的基因模塊。
模塊篩選:
通過模塊Epigengene值與不同表型(數(shù)量性狀)進(jìn)行關(guān)聯(lián)分析,篩選性狀相關(guān)模塊;篩選在缺磷和磷足夠條件下與表型呈現(xiàn)相反關(guān)聯(lián)的模塊。
模塊功能分析:GO功能富集分析。
模塊hub gene篩選:
與模塊的kME值大于0.9;分析模塊特征值在各基因型樣品中表達(dá)模式,篩選關(guān)聯(lián)高的突變體,重點(diǎn)關(guān)注突變基因及相關(guān)通路基因。


轉(zhuǎn)載請注明周小釗的博客>>WGCNA學(xué)習(xí):WGCNA應(yīng)用場景與實(shí)例解讀

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容