WGCNA筆記第二彈
1.WGCNA應(yīng)用場景
不同組織樣品
時(shí)間序列樣品:生長發(fā)育,脅迫處理
單個(gè)材料:相同處理不同時(shí)間,不同處理相同時(shí)間,不同處理不同時(shí)間
兩個(gè)材料:相同處理不同時(shí)間,不同處理相同時(shí)間,不同處理不同時(shí)間
表型數(shù)據(jù):同級相關(guān)表型的數(shù)據(jù)

2.WGCNA實(shí)驗(yàn)設(shè)計(jì)
1.時(shí)間序列樣品,兩個(gè)材料相同處理,可以一起做WGCNA分析,也可以分別做然后比較,相同材料不同處理之間也一樣
2.同一物種,不同來源的轉(zhuǎn)錄組數(shù)據(jù),可以放在一起做WGCNA,也可以分開來比較
3.一般建議15個(gè)樣品以上進(jìn)行WGCNA分析有生物學(xué)意義,可以使5個(gè)時(shí)間點(diǎn)三個(gè)重復(fù)的15個(gè)樣品
4.表型數(shù)據(jù),建議收集可以統(tǒng)計(jì)量化的性狀數(shù)據(jù),可將模塊和表型數(shù)據(jù)關(guān)聯(lián)分析,有助于篩選關(guān)鍵基因模塊和基因來解釋相關(guān)表型
3.單個(gè)材料案例
Floral Transcriptomes in Woodland Strawberry Uncover Developing Receptacle and Anther Gene Networks
野草莓花器官轉(zhuǎn)錄組解析花發(fā)育中花托和花藥的基因調(diào)控網(wǎng)絡(luò)
3.1方案設(shè)計(jì)
單個(gè)材料不同組織樣品
取材野草莓花器官不同組織
從不同發(fā)育時(shí)期的花器官分離花藥、花粉、心皮、花托等組織,再加上小苗葉片,共17個(gè)組織。每個(gè)組織兩個(gè)重復(fù),共34個(gè)樣本。
3.2 轉(zhuǎn)錄組數(shù)據(jù)整體分析

3.2 鑒定配子體孢子體相關(guān)基因
在不同發(fā)育時(shí)期花藥中共同表達(dá)的基因鑒定為雄性孢子體特異性基因
GO富集顯示,雄性孢子基因集主要為代謝生物學(xué)過程,如小分子、有機(jī)酸、細(xì)胞內(nèi)酮代謝等等
在花粉和小孢子特異表達(dá)的基因中共同表達(dá)的基因鑒定為配子體特異基因

3.3花發(fā)育過程轉(zhuǎn)錄組的時(shí)空表達(dá)模式分析
對所有差異表達(dá)的基因進(jìn)行K-means聚類分析鑒定19個(gè)cluster,呈現(xiàn)出發(fā)育時(shí)期和組織特異性表達(dá)模式,如C1 C22為心皮特異性
進(jìn)一步將19個(gè)cluster合并為10個(gè)supercluster,并進(jìn)行功能富集分析,如心皮特異性的supercluster,并進(jìn)行功能富集分析。如心皮特異性的supercluster1富集的功能為DNA合成。
對cluster中的161個(gè)轉(zhuǎn)錄因子進(jìn)行表達(dá)量聚類分析,也呈現(xiàn)發(fā)育時(shí)期和組織特異性的表達(dá)模式。

3.4 WGCNA構(gòu)建共表達(dá)網(wǎng)絡(luò)
用差異表達(dá)基因進(jìn)行WGCNA分析,鑒定了23個(gè)基因模塊。
用每個(gè)模塊的epigengene值與不同組織樣品進(jìn)行關(guān)聯(lián)分析,鑒定組織緊密關(guān)聯(lián)的基因模塊。
12個(gè)模塊與單一的組織樣品特異性高度相關(guān),如blue模塊與花粉(pollen)特異性相關(guān)。
WGCNA鑒定的組織特異性基因集合與K-means的結(jié)果相符合
WGCNA鑒定的花托特異性模塊(light yellow)和幼嫩花(stage1-4)特異性模塊(dark red),在K-means的cluster中并沒有

3.5 組織特異性表達(dá)模塊
WGCNA鑒定的花托特異性模塊(light yellow)和幼嫩花(stage1-4)特異性模塊,在K-means的cluster中并沒有。
分析了Dark red模塊和Light yellow模塊epigengene在各樣品中的表達(dá)模式
熱圖呈現(xiàn)了Dark red模塊和Light yellow模塊中每個(gè)基因在各個(gè)樣品中的表達(dá)模式


3.6 花托特異性模塊內(nèi)部分析
關(guān)鍵基因(hub gene):模塊內(nèi)網(wǎng)絡(luò)中連接度較多的基因。
關(guān)注模塊中的轉(zhuǎn)錄因子:花托特異性模塊111個(gè)基因中有27個(gè)轉(zhuǎn)錄因子,重點(diǎn)分析這些轉(zhuǎn)錄因子。
大部分hub gene為參與調(diào)控分生組織的轉(zhuǎn)錄因子,如WOX、GRS、NAC等。
hub gene中連接度最高的為GRS轉(zhuǎn)錄因子家族的FveLOM3。擬南芥中三突變體lom1 lom2 lom3表現(xiàn)出分生組織異常的表型。因此FveLOM3可能是花托發(fā)育的關(guān)鍵調(diào)控因子。
此外,高連接度的hub gene還包括一個(gè)B3 domain轉(zhuǎn)錄因子、一個(gè)Myb轉(zhuǎn)錄因子和WUS同源基因

3.7 花藥發(fā)育差異基因分析
stage9花藥中上調(diào)表達(dá)的1453個(gè)基因中,211個(gè)編碼FBX domain蛋白。在野草莓基因組中包含820個(gè)FBX基因。大比例FBX上調(diào)表達(dá)說明在花藥減數(shù)分裂這個(gè)時(shí)期發(fā)生了大量的蛋白降解。
K-means的cluster富集分析中花藥-9的cluster富集的為蛋白降解。
FBX基因表達(dá)聚類熱圖分析顯示,大部分FBX只在stage9時(shí)期暫時(shí)高表達(dá),隨后的stage10和11下調(diào)表達(dá)。
在花藥發(fā)育過程中,共296個(gè)FBX基因差異表達(dá),其中6個(gè)亞家族占的比例較大,包括FBD、LRR、DUF295

3.8花藥特異性模塊分析
花藥stage9特異性基因模塊為pink,其中包含了37個(gè)FBX基因。
通過篩選連接度較高的基因來鑒定hub gene。5個(gè)基因的度數(shù)目高于200。
其中4個(gè)基因參與蛋白降解,F(xiàn)-box、WD-repeat


3.8 小結(jié):WGCNA分析思路
實(shí)驗(yàn)方案:單個(gè)材料,不同組織樣品,所有差異表達(dá)基因進(jìn)行WGCNA分析
通過模塊Epigengene值與不同組織樣本進(jìn)行關(guān)聯(lián)分析,鑒定組織特異性模塊
hub基因篩選
連接度較高的基因
重點(diǎn)關(guān)注轉(zhuǎn)錄因子(花托特異性模塊)
前期結(jié)果中的目標(biāo)基因(話要特異性模塊中的FBX)
4.兩個(gè)材料
4.1方案設(shè)計(jì)

4.2 兩個(gè)鷹嘴豆栽培種的種子發(fā)育表性分析
兩個(gè)鷹嘴豆栽培種Himchana1(小種子,平均100粒種子重量為13.1g)和JGK3(大
種子,平均100粒種子重量為53.3g).
種子發(fā)育的7個(gè)時(shí)間段(S1-S7),分別代表了種子發(fā)育的三個(gè)階段:胚芽發(fā)育(S1-S3)、早期和中期成熟階段(籽粒灌漿,S4-S5)、成熟晚期(種子干燥,S6-S7)
種子的不同發(fā)育階段S1-S7依據(jù)授粉天數(shù)(Day after Pollination,DAP)劃分,5、9.12,19,25、30和40 DAP分別為S1、S2、S3.S4、S5、S6和S7.
表型分析:種子發(fā)育不同時(shí)間點(diǎn)的種子重量和大小的統(tǒng)計(jì)數(shù)據(jù)比較。

4.3 兩個(gè)材料種子發(fā)育過程轉(zhuǎn)錄組的整體解析
為了分析兩個(gè)材料種子發(fā)育過程轉(zhuǎn)錄組動(dòng)態(tài)變化的差異,基于16個(gè)組織樣品所有表達(dá)基因的表達(dá)量的斯皮爾曼相關(guān)系數(shù)(SCC)進(jìn)行層次聚類和主成分分析(PCA)。
兩個(gè)材料中相同發(fā)育時(shí)期組織樣品表現(xiàn)出很高的相關(guān)性。
兩個(gè)材料葉片聚在一起,與所有種子樣品表現(xiàn)出明顯差異。
兩個(gè)材料的S3有差異,JGK3-S3與S2更接近,而HC1-S3與S4更像。這說明HC1在種子發(fā)育早期比JGK3生長發(fā)育得更快。
雖然兩個(gè)材料S5也聚類在一起,但是關(guān)系并沒有其他時(shí)期的緊密,也呈現(xiàn)一定的差異。
因此,S3和S5可能是兩個(gè)材料種子大小和重量差異的關(guān)鍵發(fā)育時(shí)期

4.4 種子發(fā)育過程中差異基因表達(dá)分析
鑒定種子發(fā)育過程中每個(gè)時(shí)期特異表達(dá)的基因
各個(gè)時(shí)期特異表達(dá)的基因數(shù)目差異很大,S2最少,S5最多。
兩個(gè)材料中各自時(shí)期特異表達(dá)的基因數(shù)目也有所不同,HC1在S2最少,JGK3則在S6最少,但是兩者在S5都是最多的。
兩個(gè)材料中均時(shí)期特異表達(dá)的基因比例也不小,表達(dá)量層次聚類分析呈現(xiàn)出明顯的發(fā)育時(shí)期特異性。
說明每個(gè)發(fā)育階段有著自己獨(dú)立的發(fā)育程序。
Go富集分析,主要為生殖過程、細(xì)胞壁組裝、細(xì)胞周期和細(xì)胞分裂、碳代謝等,這些都是已知參與種子發(fā)育的。
有些GOterm在兩個(gè)材料中均富集,有些只在一個(gè)材料中富集。

4.5兩個(gè)材料差異表達(dá)基因分析
定兩個(gè)材料在種子發(fā)育每個(gè)時(shí)期的顯著差異表達(dá)基因集。
HC1 VS JGK3,共有8562個(gè)基因上調(diào)表達(dá),9023個(gè)下調(diào)表達(dá)。
差異基因數(shù)目最多的是S7,其次為S3;最少的為S4。
重點(diǎn)分析了TF,許多TF家族在JGK3中顯著上調(diào)或下調(diào)模式。
GO富集顯示,在JGK3中上調(diào)表達(dá)基因主要富集在一些細(xì)胞分裂相關(guān)term中,尤其在S3中。
代謝通路注釋分析顯示,在S3時(shí)期某些代謝通路呈現(xiàn)顯著的差異。
在JGK3中淀粉代謝和光合作用相關(guān)基因激活表達(dá),細(xì)胞周期和細(xì)胞分裂相關(guān)基因也上調(diào)表達(dá)。
在S3時(shí)期JGK3中細(xì)胞壁合成和修飾的許多基因上調(diào)表達(dá)。

4.6 WGCNA鑒定共表達(dá)基因模塊
WGCNA分別鑒定了HC1的27個(gè)基因模塊和JGK3的21個(gè)基因模塊。
所有模塊中都包含TF,數(shù)量從幾個(gè)到幾百個(gè)不等。
模塊和發(fā)育時(shí)期樣品關(guān)聯(lián)分析(PCC),13個(gè)HC1模塊和6個(gè)JGK3模塊與發(fā)育時(shí)期樣品高度關(guān)聯(lián)(0.6以上)。
許多模塊不僅與一個(gè)發(fā)育時(shí)期關(guān)聯(lián),一些模塊僅與某個(gè)特定發(fā)育時(shí)期樣品關(guān)聯(lián)。如JGK 3的lightyellow模塊與S4高度特異關(guān)聯(lián)(0.93).
模塊的GO富集分析結(jié)果與差異表達(dá)基因分析結(jié)果相一致。如,種子發(fā)育早期相關(guān)模塊主要富集的GO term為細(xì)胞分離、細(xì)胞形態(tài)、細(xì)胞壁組裝、基因表達(dá)調(diào)控。

4.7 兩個(gè)材料的基因模塊保守性分析
鑒定兩個(gè)材料共表達(dá)基因模塊的保守性。
計(jì)算不同模塊中的相同基因數(shù)目,然后通過Fisher精確檢驗(yàn)的P-value值評估顯著性。
兩個(gè)材料中大部分保守模塊關(guān)聯(lián)的是相似的種子發(fā)育時(shí)期樣品。
少部分保守模塊在不同材料中表型不同的發(fā)育時(shí)期關(guān)聯(lián)性和轉(zhuǎn)錄激活時(shí)期。
鑒定了材料特異性模塊,如HC1的3個(gè)模塊(organe-HS4等)和4個(gè)JGK3模塊(如lightgreen-JS4)。
HC1特異性模塊主要富集GO term為轉(zhuǎn)錄調(diào)控、細(xì)胞程序性死亡、衰老等;JGK3特異性模塊富集的為DNA復(fù)制、細(xì)胞分裂、基因表達(dá)、蛋白修飾等。

4.8 種子發(fā)育和種子大小、重量相關(guān)轉(zhuǎn)錄調(diào)控模塊分析
目的:鑒定JGK3發(fā)育S3和S5的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)。主要為TFs及其共表達(dá)的靶基因(包含TFs結(jié)合位點(diǎn),motif顯著富集分析)
候選模塊:HC1和JGK3中與S3、S5時(shí)期相關(guān)的共表達(dá)基因模塊
JGK3的S3時(shí)期相關(guān)模塊brown轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò):顯著富集的DNA motifs有ATHB1、JASE1等,相關(guān)的TFs有woX9、PDF2、RLT2等,以及靶基因相關(guān)的GO term,基因表達(dá)調(diào)控、細(xì)胞壁組裝、表達(dá)大小調(diào)控等。
比較JS3和HS3模塊轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò),大部分組分是相同的,但是也有一些材料特異性的組分。
同樣也分析了JS5和HS5相關(guān)模塊轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)組分,包括DNA motifs、TFs,以及GO term。
JS5和HS5的調(diào)控網(wǎng)絡(luò)大部分組分是相同的,但是也有一些材料特異性的組分。
該分析鑒定了種子發(fā)育中的關(guān)鍵調(diào)控因子,兩個(gè)材料的調(diào)控相似但不完全一樣。

4.9 種子發(fā)育和種子大小、重量相關(guān)轉(zhuǎn)錄調(diào)控模塊分析
一些基因模塊在兩個(gè)材料的S3和S5時(shí)期表現(xiàn)出相反表達(dá)模式。
主要有3類:HS3下調(diào)JS3上調(diào),HS3上調(diào)JS3下調(diào),HS5下調(diào)JS5上調(diào)。
這些模塊可能與兩個(gè)材料種子發(fā)育不同相關(guān),進(jìn)行轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)分析。
HJ3上調(diào)JS3下調(diào)轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)鑒定:motifs、TF、GOterms。
S3時(shí)期的top hub基因表達(dá)模式反應(yīng)了這不同模塊中所有基因的表達(dá)模式。
這些網(wǎng)絡(luò)中的許多motifs、TFs都是已知參與調(diào)控種子大小、重量的重要調(diào)控因子。

4.10 小結(jié)
實(shí)驗(yàn)方案:兩個(gè)材料,不同發(fā)育時(shí)期樣品,所有差異表達(dá)基因進(jìn)行WGCNA分析。
兩個(gè)材料分別進(jìn)行WGCNA分析鑒定各自的基因模塊。
通過模塊Epigengene值與不同發(fā)育時(shí)期樣品進(jìn)行關(guān)聯(lián)分析,鑒定時(shí)期特異性模塊,并通過模塊GO功能富集來解析各發(fā)育時(shí)期的調(diào)控機(jī)制。
兩個(gè)材料模塊保守性分析,鑒定保守性和特異性模塊,通過Go富集解析各自表型。
模塊篩選:
依據(jù)前面研究結(jié)果S3和S5兩個(gè)材料差異最大,重點(diǎn)分析這兩個(gè)時(shí)期相關(guān)的基因模塊。
依據(jù)表達(dá)模式篩選在兩個(gè)材料的S3和S5時(shí)期表現(xiàn)出相反表達(dá)模式的模塊。
轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)關(guān)鍵基因篩選:TFs和包含顯著富集motifs的靶基因、top 20/40 hub gene。
5. 表型數(shù)據(jù)
Root Cell-Specific Regulators of Phosphate-Dependent Growth
5.1 PRCE在根部的細(xì)胞特異性表達(dá)驗(yàn)證和T-DNA插入突變體篩選
構(gòu)建了12個(gè)PRCE基因的啟動(dòng)子-GFP轉(zhuǎn)基因line,驗(yàn)證它們是否呈現(xiàn)細(xì)胞特異性表達(dá)模式。
其中10個(gè)基因表現(xiàn)出嚴(yán)格的細(xì)胞類型特異性表達(dá)模式(皮層、中柱鞘、中柱、木質(zhì)部薄壁細(xì)胞等)。
篩選鑒定了11個(gè)PRCE基因的T-DNA插入純合突變體,其中10個(gè)為功能缺失突變體,1個(gè)為功能獲得型突變體。

5.2 突變體表型分析
prce突變體在磷足夠和缺乏條件下,植物根和芽中磷的濃度變化。
prce突變體在磷足夠和缺乏條件下,植物生長情況,根和芽中生物量的變化。
大部分prce突變體表現(xiàn)出明顯不同于野生型(Col-0)的特征,包括所有定量的生理表型。


5.3 prce突變體根中相應(yīng)基因的轉(zhuǎn)錄水平變化
選取以前發(fā)表文獻(xiàn)中的缺磷的兩個(gè)轉(zhuǎn)錄組數(shù)據(jù)集,包含不同的基因型材料,其中Col-0和phr1-1為對照材料。
在兩個(gè)數(shù)據(jù)集中,Col-0的63%和6%的PSR基因在phr1-1中沒有變化;許多野生型PSR基因在prce突變體中呈現(xiàn)出不同的表達(dá)。
在兩個(gè)數(shù)據(jù)集中篩選了Col-0中差異表達(dá)2倍以上的831個(gè)磷響應(yīng)核心基因,進(jìn)步通過層次聚類分析其在不同基因型材料中的表達(dá)模式。并依據(jù)基因表達(dá)模式分析不同基因型樣品之間的關(guān)系。
S6k2突變體表現(xiàn)出與phr1-1類似的缺磷反應(yīng),而wdd1突變體表現(xiàn)出類似Col-0的缺磷反應(yīng)。

5.4 鑒定prce突變體相關(guān)共表達(dá)網(wǎng)絡(luò)
對32個(gè)RNA-seq數(shù)據(jù)集(磷足夠和磷缺乏)的所有表達(dá)轉(zhuǎn)錄本分別進(jìn)行WGCNA分析,都鑒定了18個(gè)共表達(dá)基因模塊。
計(jì)算模塊的特征值(Eigengene),并通過特征值來計(jì)算模塊和生理性狀(數(shù)量性狀,如磷含量和濃度、生物量、根相對生長速率、初根根長等)的相關(guān)性。
重點(diǎn)關(guān)注與性狀顯著相關(guān)的10個(gè)模塊,以及在不同基因型中呈現(xiàn)相反表達(dá)模式的模塊。
缺磷時(shí),yellowf和red模塊與生物量顯著正相關(guān);磷充足時(shí),black模塊與生物量顯著負(fù)相關(guān)。
與生物量呈現(xiàn)相反關(guān)聯(lián)的還有缺磷的green模塊和磷足夠的pink模塊。

5.5 重點(diǎn)模塊和模塊內(nèi)hub基因分析
缺磷的yellow模塊,包含684個(gè)基因,與生物量、磷含量、根芽比例都顯著相關(guān)。其中24%基因與之前轉(zhuǎn)錄組鑒定的PSI基因相一致。
模塊基因,相對野生型,在phr1-1中下調(diào)表達(dá),在prce突變體(cb/1、prce2等)上調(diào)表達(dá)。
篩選與該模塊的ME(kME)排在前300的基因進(jìn)行富集分析,顯著富集的GO term有缺磷相關(guān)、磷脂和半乳糖脂代謝等。
模塊hub gene篩選:kME大于0.9。主要為脂代謝、感知磷、磷信號導(dǎo)、磷運(yùn)輸?shù)认嚓P(guān)基因。
Yellow模塊在cb/1中表現(xiàn)較高的ME值,說明鈣信號通過CBL1影響磷轉(zhuǎn)運(yùn)。進(jìn)一步篩選該模塊中鈣信號相關(guān)基因,重點(diǎn)關(guān)注,作為hub gene候選。


5.6 小結(jié)
實(shí)驗(yàn)方案:兩種處理,不同基因型樣品,所有表達(dá)基因進(jìn)行WGCNA分析。
兩種處理分別進(jìn)行WGCNA分析鑒定各自的基因模塊。
模塊篩選:
通過模塊Epigengene值與不同表型(數(shù)量性狀)進(jìn)行關(guān)聯(lián)分析,篩選性狀相關(guān)模塊;篩選在缺磷和磷足夠條件下與表型呈現(xiàn)相反關(guān)聯(lián)的模塊。
模塊功能分析:GO功能富集分析。
模塊hub gene篩選:
與模塊的kME值大于0.9;分析模塊特征值在各基因型樣品中表達(dá)模式,篩選關(guān)聯(lián)高的突變體,重點(diǎn)關(guān)注突變基因及相關(guān)通路基因。
轉(zhuǎn)載請注明周小釗的博客>>WGCNA學(xué)習(xí):WGCNA應(yīng)用場景與實(shí)例解讀