WGCNA分析中如何選擇軟閾值?
這次依然還是給你拋出官網(wǎng)教程,依然是:你看還是不看,它就在那里,等著你的深入研究~
https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
如有理解錯誤,還請各位大神批評指正!
依然是這張圖:

上次簡單說了一下小編對于軟閾值的理解,接著上次的文章,這次我們來說一下:
- 如何選取Soft Threshold,多少的時候合適?(即上圖中左右圖的意思和縱坐標的理解)
- 對于這張圖的說明,官網(wǎng)給出的注釋是這個樣子的:
Figure 1: Analysis of network topology for various soft-thresholding powers. The left panelshows the scale-free fit index (y-axis) as a function of the soft-thresholding power (x-axis). The right panel displays the mean connectivity(degree, y-axis) as a function of the soft-thresholding power (x-axis).
實現(xiàn)這張圖的代碼:

1,左圖的縱坐標scale-free fit index,即signed R2,代表對應的網(wǎng)絡中l(wèi)og(k)與log(p(k))相關系數(shù)的平方乘以一個方向向量,由slope決定(The sign of the scale-free model fitting index R2 is determined by minus the sign of the slope),擬合的線性方程為下圖,來源于WNCGCNA包中的源代碼:

相關系數(shù)的平方越高,說明該網(wǎng)絡越逼近無標度網(wǎng)絡的分布。相關參考文獻中有大量數(shù)據(jù)證明當signed R2 大于0.85時,網(wǎng)絡就已經(jīng)符合無標度網(wǎng)絡的分布。
因此,WGCNA包中計算SoftThreshold的函數(shù)pickSoftThreshold中RsquaredCut 默認值為 0.85,最佳的powers值保存在sft$powerEstimate。上圖中,作者重新設定了一個閾值cex1=0.9,因此你會看到圖片作圖中有一條紅色的橫線,表示第一個signed R2達到這條紅線時的最佳powers值,此圖中是6。
2,右圖的縱軸代表對應的網(wǎng)絡中所有基因連接數(shù)(即節(jié)點的度)的均值。
另外,官網(wǎng)教程中給的上述的圖其實有一個小錯誤,心細的同學應該發(fā)現(xiàn)了吧,正確的圖時下面小編自己用官網(wǎng)的數(shù)據(jù)和教程重新繪制的一張!

參考資料:
1,https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
2,A General Framework for Weighted Gene Co-Expression Network Analysis, Stat Appl Genet Mol Biol. 2005;4:Article17. Epub 2005 Aug 12
3,WGCNA: an R package for weighted correlation network analysis.BMC Bioinformatics. 2008 Dec 29;9:559. doi: 10.1186/1471-2105-9-559.