GWAS分析-R包GAPIT (四)

GAPIT (Genome Associated Prediction Integrated Tool),是一個R包,使用Gapit可以進行全基因組關(guān)聯(lián)分析和基因組預(yù)測(選擇)。這個R包中包含各種模型(unified mixed model, EMMA, CMLMl和P3D/EMMAx等)用于GWAS分析。我認為這個R包對初學者是相當友好的,我們不用準備群體結(jié)構(gòu),親緣關(guān)系文件等等,只需要準備兩個文件,基因型文件和表型文件即可,GAPIT會自動幫你分析,做圖。非常方便。

今天主要講一下如何利用GAPIT進行GWAS分析。

接下來,我們看看如何安裝GAPIT和如何使用該R包進行GWAS分析。
GAPIT網(wǎng)址(https://www.maizegenetics.net/gapit
GAPIT使用手冊(https://zzlab.net/GAPIT/gapit_help_document.pdf

第一步:加載R包-GAPIT

library(multtest)
library(gplots)
library(LDheatmap)
library(genetics)
library(ape) 
library(EMMREML)
library(compiler) 
library("scatterplot3d")
library(grid)

source("http://zzlab.net/GAPIT/GAPIT.library.R")
source("http://zzlab.net/GAPIT/gapit_functions.txt") #這兩條命令可以下載一些GAPIT相關(guān)的R包,默認安裝即可

注意:我使用的R版本為3.6.0, 對于不存在的R包,使用BiocManager::install("package name")進行安裝。

第二步:準備文件,這里使用該R包帶的示例文件

setwd("/Desktop/軟件使用/GWAS/gapit/") #確定文件和結(jié)果路徑

我們輸入的文件分別是mdp_genotype_test.hmp.txt(基因型文件)和mdp_traits.txt(表型文件)。
我們可以先看一下文件格式。

基因型文件:mdp_genotype_test.hmp.txt


基因型文件格式.jpg

數(shù)據(jù)格式為hapmap,后面也會繼續(xù)給大家分享不同格式文件如何互相轉(zhuǎn)換。
前11列顯示了SNP的屬性,其余的列顯示了群體中每個個體在每個SNP上觀察到的基因型。第一行為標題標簽,其余每行包含單個SNP的所有信息。

表型文件格式:mdp_traits.txt


表型文件格式.jpg

該表格以Tab鍵分隔,表格第一行是表頭,包含四列。
第一列:用于GWAS分析群體每個個體編號,缺失數(shù)據(jù)用NaN代替,個體編號要與基因型文件中個體編號保持一致。
第二列到第四列:GWAS分析的表型,用戶也可根據(jù)自己分析表型數(shù)量進行添加。

第三步:讀入數(shù)據(jù),并進行分析

myY <- read.table("mdp_traits.txt", head = TRUE) #讀入表型數(shù)據(jù)
myG <- read.table("mdp_genotype_test.hmp.txt", head = FALSE) #讀入基因型數(shù)據(jù)
myGAPIT <- GAPIT(Y=myY,G=myG,PCA.total=3) #我們先選擇基本應(yīng)用模式,基本應(yīng)用需要兩個文件(表型數(shù)據(jù)文件和基因型文件)和一個主成分的個數(shù)(PCA.total);GAPIT 會自動計算 K 矩陣(VanRaden 方法);用默認的聚類算法(平均)和 group kinship type(Mean)進行 GWAS 分析。

我們也可以同時選擇多個模型進行分析。

myGAPIT_mutiple <- GAPIT(Y=myY, G=myG,PCA.total=3, model=c("GLM", "MLM", "CMLM", "FarmCPU"), Multiple_analysis=TRUE)

在這我們不分析,感興趣的小伙伴可以自己嘗試一下。

運行一段時間后,會自動產(chǎn)生所有分析結(jié)果,分析結(jié)果主要包括兩種形式,.pdf圖片和.csv文件。

results.jpg

這些結(jié)果包括PCA結(jié)果和manhattan圖和QQ圖等等。
GAPIT.PCA.3D.jpg

GAPIT.MLM.EarDia.Manhattan.Plot.Genomewise.jpg
GAPIT.MLM.EarDia.QQ-Plot.jpg

如果大家感覺R包GAPIT自動畫的圖不好看,可以找到對應(yīng)的*.csv文件,使用R自己做圖??傮w來說,該R包對新用戶來說還是非常友好,并且功能強大。

往期回顧:
GWAS分析 (一)
http://www.itdecent.cn/p/67e1878845e3
GWAS分析-曼哈頓圖 (二)
http://www.itdecent.cn/p/fa261b6045c2
GWAS分析-常用文件格式 (三)
http://www.itdecent.cn/p/ad47f575e83b

參考文獻:
1.The analysis was performed with a compressed mixed linear model (Zhang et al., 2010) implemented in the GAPIT R package (Lipka et al., 2012).
2.百度百科

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容