MTAG(multi-trait analysis of GWAS)

又開(kāi)始一個(gè)新的軟件啦,大家是否有需要的?可以同一人群的不同trait做。咱們就開(kāi)始吧~
官網(wǎng)地址:URLs. MTAG software is available at https://github.com/omeed-maghzian/mtag/.
文章:Multi-trait analysis of genome-wide association summary statistics using MTAG
Patrick Turley ,2018,NG
看看人家這引用率。


老規(guī)律,進(jìn)入官網(wǎng)界面后下載軟件。

git clone https://github.com/omeed-maghzian/mtag.git
cd mtag

這是基于python,所以要提前裝好。 需要Python 2.7。如果你的anaconda是python3,那得創(chuàng)建python2.7的環(huán)境。(參考網(wǎng)址https://conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html#creating-an-environment-with-commands
conda create -n myenv_py2.7 python=2.7

激活。以后進(jìn)來(lái)每次激活就可以,不用重新創(chuàng)建了。
conda activate myenv_py2.7
用完了退出環(huán)境
conda deactivate

tutorial鏈接https://github.com/omeed-maghzian/mtag/wiki/Tutorial-1:-The-Basics
開(kāi)始啟動(dòng)程序:
python mtag.py -h #出來(lái)一大推,說(shuō)明軟件沒(méi)問(wèn)題了。

文件準(zhǔn)備

下載兩個(gè)示例數(shù)據(jù)
wget http://ssgac.org/documents/1_OA2016_hm3samp_NEUR.txt.gz
wget http://ssgac.org/documents/1_OA2016_hm3samp_SWB.txt.gz
兩個(gè)示例文件都是GWAS summary結(jié)果,空格分隔的txt文件。如圖:


這幾列都是必須要有的。順序沒(méi)關(guān)系,但列名一定要指定或同默認(rèn)。
多個(gè)trait文件snp要匹配,也可以用--snp-name指定。
a1是effect allel,也可以用--a1_name指定。同理a2,freq也可以指定。
z是GWAS的效應(yīng)大小。也可以用beta和se。--use_beta_se默認(rèn)識(shí)別的列名為beta,se,也可以用--beta_name and --se_name指定名稱(chēng)。
n為樣本量,也可以用--n_name指定。
因?yàn)橛?jì)算時(shí)候用到ldsc,所有有些格式需要ldsc能夠識(shí)別。
染色體和bp也可以用--chr_name and --bpos_name指定。

運(yùn)行軟件

大致計(jì)算過(guò)程:
1.讀取GWAS summary結(jié)果,通過(guò)minor allele frequency (MAF) >= 0.01和sample size N >= (2/3) * 90th percentile來(lái)過(guò)濾數(shù)據(jù)。
2.合并過(guò)濾后的GWAS匯總統(tǒng)計(jì)結(jié)果,得到可用snp的交集。
3.通過(guò)LD分?jǐn)?shù)來(lái)估計(jì)殘差的協(xié)方差矩陣。
4.估計(jì)遺傳協(xié)方差矩陣。
5.運(yùn)行MTAG輸出結(jié)果。

代碼:

python /[path]/mtag.py  \
    --sumstats 1_OA2016_hm3samp_NEUR.txt,1_OA2016_hm3samp_SWB.txt \
    --out ./tutorial_results_1.1NS \
    --n_min 0.0 \
    --stream_stdout &

記得上面的path要改啊,就是mtag.py的路徑。
--n_min 0.0使樣本量少的數(shù)據(jù),避免snp的丟失。
--stream_stdout生成log文件。
--out可以指定文件夾和前綴。[DIR]/[TAG]

生成結(jié)果是這樣的:

結(jié)果文件

[TAG].log:這個(gè)就不用說(shuō)了吧。

[TAG]_sigma_hat.txt:存儲(chǔ)估計(jì)的殘差協(xié)方差矩陣。

[TAG]_omega_hat.txt:存儲(chǔ)估計(jì)的遺傳協(xié)方差矩陣。

以下兩個(gè)文件是分隔符分隔的文件,包含了MTAG矯正后的效應(yīng)值和se的結(jié)果,與輸入的gwas summary文件其余部分相同。

[TAG]_trait_1.txt

[TAG]_trait_2.txt

主要看mtag_beta,pvalue.

以上是最基本的操作,還有后續(xù)的
Tutorial 2: Special Options
Tutorial 3: maxFDR Calculation
有時(shí)間再寫(xiě)吧!謝謝觀賞!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容