孟德爾隨機(jī)化研究----UKBB-gwas詳解

公眾號有何AI與醫(yī)學(xué):孟德爾隨機(jī)化準(zhǔn)備從大家問題多地方以及簡單介紹寫起來,然后補(bǔ)全整個分析流程!歡迎轉(zhuǎn)發(fā)關(guān)注哦!

UK Biobank

生物銀行(Biobank)是指通過標(biāo)準(zhǔn)化流程,收集并長期儲存人體生物樣本(如血液和 DNA)及采集對象生理、病理、社會經(jīng)濟(jì)信息的資源庫,本質(zhì)上也是一種大樣本的人群前瞻性隊列研究。英國生物銀行(UK Biobank,簡稱UKB;官網(wǎng):https://www.ukbiobank.ac.uk/)作為目前世界上最為知名和開放的生物銀行,自2006年建立以來已收集了英國各地50萬名參與者的血液、尿液和唾液樣本,以及完善的人口學(xué)、社會經(jīng)濟(jì)、生活方式和健康信息。這里我們主要介紹UKB公開的GWAS數(shù)據(jù),對其它付費數(shù)據(jù)感興趣可以參考下邊鏈接(https://zhuanlan.zhihu.com/p/532396312)。

匯總數(shù)據(jù)庫

UKBB-gwas數(shù)據(jù)被很多匯總數(shù)據(jù)庫收納,最出名的當(dāng)屬IEU OPEN GWAS(https://gwas.mrcieu.ac.uk/)。


使用IEU調(diào)取UKB-gwas比較簡單,直接搜索表型,然后UKBB的也會被搜索出來,通過ID直接調(diào)取就好了,IEU已經(jīng)對數(shù)據(jù)重新進(jìn)行了質(zhì)控和檢驗,所需要的變量都應(yīng)經(jīng)存在。


GWAS Catalog數(shù)據(jù)庫也納入了很多UKB數(shù)據(jù)(https://www.ebi.ac.uk/gwas/search?query=breast%20carcinoma),但是沒有IEU的全面。GWAS Catalog更新的要比IEU快。內(nèi)部消息IEU后邊可能要停更了。GWAS Catalog用法下期詳解。


UKBB-gwas詳解

UKBB-gwas目錄保存在谷歌的table中,地址(https://docs.google.com/spreadsheets/d/1kvPoupSzsSFBNSztMzl04xMoSC3Kcx3CrjVf4yBmESU/edit#gid=227859291)


我們可以看到,一個表型更具數(shù)據(jù)類型,性別做了6次GWAS分析,這是UKB原始庫最大的特點,當(dāng)我們的疾病和性別有關(guān)系時候那么選擇UKB原始數(shù)據(jù)再好不過。性別很好理解,但是irrt和raw數(shù)據(jù)有什么區(qū)別,這里使用表型Food weight 來一探究竟,分別下載下載雙性別irrt和raw數(shù)據(jù)。

1服務(wù)器下載:

2

3wget https://broad-ukb-sumstats-us-east-1.s3.amazonaws.com/round2/additive-tsvs/100001_irnt.gwas.imputed_v3.both_sexes.tsv.bgz -O 100001_irnt.gwas.imputed_v3.both_sexes.tsv.bgz

4

5wget https://broad-ukb-sumstats-us-east-1.s3.amazonaws.com/round2/additive-tsvs/100001_raw.gwas.imputed_v3.both_sexes.tsv.bgz -O 100001_raw.gwas.imputed_v3.both_sexes.tsv.bgz

由于.bgb不好解壓,也不好讀入,這里直接改成.gz,本地操作直接重命名,服務(wù)器代碼如下:

1mv 100001_irnt.gwas.imputed_v3.both_sexes.tsv.bgz 100001_irnt.gwas.imputed_v3.both_sexes.tsv.gz

2

3mv 100001_raw.gwas.imputed_v3.both_sexes.tsv.bgz 100001_raw.gwas.imputed_v3.both_sexes.tsv.gz

4

5# 使用R語言讀入

6

7f<-fread("100001_raw.gwas.imputed_v3.both_sexes.tsv.gz")

8g<-fread("100001_irnt.gwas.imputed_v3.both_sexes.tsv.gz")

9

10# 查看

11head(f)

12head(g)



我們觀察發(fā)現(xiàn),兩者共同點都沒有rsID,兩者最大的區(qū)別就是Beta值的不同,raw的Beta比較大,顯然不符合我們做孟德爾隨機(jī)化研究。

新年快樂

祝大家2023新年快樂,2023將繼續(xù)保持極簡的風(fēng)格分享知識。行路難!行路難!多岐路,今安在? 長風(fēng)破浪會有時,直掛云帆濟(jì)滄海。一句詩詞與大家共勉。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容