主要更新內(nèi)容:
- 對GeneID做了防呆處理。
- 對表型數(shù)據(jù)和表達(dá)量數(shù)據(jù)的sample排序做了防呆處理。
- 增加了兩個函數(shù)
- mergeCutHeight 模塊合并剪枝高度
- minModuleSize 模塊最小基因數(shù)量
解釋:
GeneID防呆處理,有些用戶反映說會報表達(dá)量矩陣有空行等錯誤,看過之后發(fā)現(xiàn)大部分都有一個特點,就是geneID是純數(shù)字,要知道,在R里面讀取數(shù)據(jù)
read.table時,如果你這一列都是數(shù)字,R會自動的認(rèn)為這一類的數(shù)據(jù)類型是numeric,其實在把表達(dá)量矩陣讀取到R之后,有一步操作是把第一列GeneID變?yōu)樾忻?code>rownames,如果恰好你的geneID是純數(shù)字,而且連續(xù)性較差,會導(dǎo)致rownames的不連續(xù),r會認(rèn)為跳過的那些行是缺失行,在后續(xù)會報錯。這里的解決方案就是讀取進(jìn)來后把第一列g(shù)eneID的數(shù)據(jù)類型直接轉(zhuǎn)換為字符串character表型數(shù)據(jù)和表達(dá)量數(shù)據(jù)的樣品順序防呆處理:由于習(xí)慣原因,我在之前的項目中首先會把表達(dá)量數(shù)據(jù)和表型數(shù)據(jù)中sample的順序調(diào)整成一致的,然而在我的腳本中并沒有考慮到他們不一致的情況,以至于到后面做
trait-module的時候如果你表型和表達(dá)量的順序不一致會出現(xiàn)張冠李戴,這里我加了一樣代碼用match命令將表達(dá)量和表型數(shù)據(jù)的rowname進(jìn)行匹配。這里建議用戶重新做一遍之前的數(shù)據(jù),防止出錯!!-
增加兩個參數(shù):之前在做的時候由于我的模塊太多,于是我把
mergeCutHeight調(diào)大了(0.4,官網(wǎng)建議0.25),這個函數(shù)最粗糙的理解就是你把基因做了聚類之后通過對聚類數(shù)高度的修剪把基因劃分到一個個模塊中,如果這個高度越小,劃分的模塊越多,這個高度越大,小模塊就會被合并到一起,從而模塊越少,對比02.xxx.module.pdf。這里把這個參數(shù)放開自己調(diào)整,這樣還有個好處,合并了很多小模塊之后很可能模塊內(nèi)基因的表達(dá)模式也有不同,那么在與性狀做關(guān)聯(lián)的時候可能關(guān)聯(lián)性也比較低。那么是不是把模塊劃分的更加細(xì)致后可能得到比較高的相關(guān)。
Cluster DendrogramminModuleSize這個參數(shù)是確定模塊最小基因數(shù)目的。更新方法:
方法一: 從高速插件商店安裝
image
方法二: 從gitee下載安裝
OneStepWGCNA-plugin點擊鏈接,然后下載。

