GWAS

網(wǎng)頁(yè)方式easyGWAS

1、創(chuàng)建并登陸一個(gè)easyGWAS帳戶;

2、一個(gè)物種和一個(gè)數(shù)據(jù)集,以及一個(gè)基因注釋集(可選)。例如:選擇物種擬南芥、數(shù)據(jù)集AtPolyDB(調(diào)用方法 75,Horton 等人)和基因注釋集基因注釋 (TAIR9);

3、選擇一個(gè)表型,總共可以選擇 5 種表型,在本教程中,我們通過(guò)鍵入名稱來(lái)選擇兩種表型LDLDV;

4、表型分布的直方圖和 Shapiro-Wilk 檢驗(yàn)的 p 值,Shapiro-Wilk 檢驗(yàn)檢驗(yàn)數(shù)據(jù)來(lái)自正態(tài)分布的原假設(shè),Log10轉(zhuǎn)換


5、可以在實(shí)驗(yàn)中添加協(xié)變量或主成分。但是,此步驟是可選的,在本教程中,我們通過(guò)單擊“繼續(xù)”來(lái)跳過(guò)它。

6、可以選擇所有可用的 SNP 進(jìn)行分析,也可以選擇一組染色體;


7、必須選擇要用于分析的算法和過(guò)濾器。首先,我們選擇10% 的次要等位基因頻率過(guò)濾器。接下來(lái),我們?yōu)槊總€(gè)表型選擇算法EMMAX并單擊繼續(xù);


8、可以通過(guò)單擊Submit GWAS將 GWAS 提交到計(jì)算服務(wù)器。


9、計(jì)算完成后我們將通過(guò)電子郵件收到通知。


上傳的文件格式

存儲(chǔ)基因型數(shù)據(jù)需要兩個(gè)文件:PED 和 MAP 文件。

PED 文件開(kāi)頭有 6 個(gè)固定列,后跟 SNP 信息。各列應(yīng)由空格或制表符分隔。前六列包含以下信息:


家庭 ID(如果未知,請(qǐng)使用與第二列中的樣本 ID 相同的 ID)

樣品編號(hào)

父親 ID(如果未知,請(qǐng)使用 0)

母親 ID(如果未知,請(qǐng)使用 0)

性別(如果未知?jiǎng)t使用 0)

未使用,設(shè)置為0

其余列:SNP

MAP 文件包含有關(guān)每個(gè) SNP 的信息。每一行對(duì)應(yīng) PED 文件中的一個(gè) SNP;SNP 的順序必須與 PED 文件中的順序相同,即 MAP 文件中的行順序必須與 PED 文件中的列匹配(從第 7 列開(kāi)始)


MAP 文件必須恰好有四列,其中包含以下信息(各列應(yīng)以空格或制表符分隔):

染色體 ID(例如 Chr1 代表染色體 1)

唯一的 SNP 標(biāo)識(shí)符

基因組距離(如果未知?jiǎng)t使用 0)

單核苷酸多態(tài)性 (SNP) 位置


R語(yǔ)言跑GWAS

https://www.r-bloggers.com/2017/10/genome-wide-association-studies-in-r/

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容