網(wǎng)頁(yè)方式easyGWAS
1、創(chuàng)建并登陸一個(gè)easyGWAS帳戶;

2、一個(gè)物種和一個(gè)數(shù)據(jù)集,以及一個(gè)基因注釋集(可選)。例如:選擇物種擬南芥、數(shù)據(jù)集AtPolyDB(調(diào)用方法 75,Horton 等人)和基因注釋集基因注釋 (TAIR9);

3、選擇一個(gè)表型,總共可以選擇 5 種表型,在本教程中,我們通過(guò)鍵入名稱來(lái)選擇兩種表型LD和LDV;

4、表型分布的直方圖和 Shapiro-Wilk 檢驗(yàn)的 p 值,Shapiro-Wilk 檢驗(yàn)檢驗(yàn)數(shù)據(jù)來(lái)自正態(tài)分布的原假設(shè),Log10轉(zhuǎn)換

5、可以在實(shí)驗(yàn)中添加協(xié)變量或主成分。但是,此步驟是可選的,在本教程中,我們通過(guò)單擊“繼續(xù)”來(lái)跳過(guò)它。
6、可以選擇所有可用的 SNP 進(jìn)行分析,也可以選擇一組染色體;

7、必須選擇要用于分析的算法和過(guò)濾器。首先,我們選擇10% 的次要等位基因頻率過(guò)濾器。接下來(lái),我們?yōu)槊總€(gè)表型選擇算法EMMAX并單擊繼續(xù);

8、可以通過(guò)單擊Submit GWAS將 GWAS 提交到計(jì)算服務(wù)器。

9、計(jì)算完成后我們將通過(guò)電子郵件收到通知。
上傳的文件格式
存儲(chǔ)基因型數(shù)據(jù)需要兩個(gè)文件:PED 和 MAP 文件。
PED 文件開(kāi)頭有 6 個(gè)固定列,后跟 SNP 信息。各列應(yīng)由空格或制表符分隔。前六列包含以下信息:

家庭 ID(如果未知,請(qǐng)使用與第二列中的樣本 ID 相同的 ID)
樣品編號(hào)
父親 ID(如果未知,請(qǐng)使用 0)
母親 ID(如果未知,請(qǐng)使用 0)
性別(如果未知?jiǎng)t使用 0)
未使用,設(shè)置為0
其余列:SNP
MAP 文件包含有關(guān)每個(gè) SNP 的信息。每一行對(duì)應(yīng) PED 文件中的一個(gè) SNP;SNP 的順序必須與 PED 文件中的順序相同,即 MAP 文件中的行順序必須與 PED 文件中的列匹配(從第 7 列開(kāi)始)

MAP 文件必須恰好有四列,其中包含以下信息(各列應(yīng)以空格或制表符分隔):
染色體 ID(例如 Chr1 代表染色體 1)
唯一的 SNP 標(biāo)識(shí)符
基因組距離(如果未知?jiǎng)t使用 0)
單核苷酸多態(tài)性 (SNP) 位置
R語(yǔ)言跑GWAS
https://www.r-bloggers.com/2017/10/genome-wide-association-studies-in-r/