【數(shù)據(jù)庫-7】ExAC數(shù)據(jù)庫

歡迎關(guān)注公眾號oddxix

如果覺得寫的不錯記得點個贊,謝謝支持~


1.簡介

官網(wǎng):http://exac.broadinstitute.org
ExAC數(shù)據(jù)庫的全稱是(the Exome Aggregation Consortium,外顯子組整合數(shù)據(jù)庫),該數(shù)據(jù)庫旨在匯總和協(xié)調(diào)各種大規(guī)模測序項目的外顯子組測序數(shù)據(jù),并為更廣泛的科學界提供摘要數(shù)據(jù)。所有數(shù)據(jù)均基于GRCh37 / hg19。2016年8月,Nature刊登了一篇ARTICLE,主要重點就是哈佛-麻省理工Broad研究所的科學家公布了60706名不同種族個體的外顯子序列。整合了多個研究項目的外顯子集合協(xié)作組(ExAC)分析了來自不同祖先的共60706位個人的高質(zhì)量外顯子測序數(shù)據(jù),通過深度分析制作的人類遺傳變異數(shù)據(jù)庫ExAC并制定了每個序列變異的致病性的精確度量標準。研究鑒定了根據(jù)選擇壓力區(qū)別的突變類型;鑒定了3230個基因截短突變,其中72%的基因沒有與已知的人類疾病表型建立關(guān)系。ExAC數(shù)據(jù)庫可以用來過濾潛在的致病性突變,避免遺傳誤診以及發(fā)現(xiàn)更多遺傳性疾病的致病因素及根源提供了有力的工具。


1.1三大數(shù)據(jù)庫數(shù)量對比

1、1000 Genomes(共2,504個,全基因組和外顯子)
2、ESP(6,503個,僅外顯子)
3、ExAC(60,706個,僅外顯子)

從覆蓋全面性來說,ESP和ExAC僅覆蓋外顯子,顯然不如1000Genomes全面;從樣品數(shù)量上來說,毋庸置疑,ExAC有6萬多,而其他兩個都在千級,自然是ExAC數(shù)量占優(yōu)勢。但是,重要的事情說三遍,要知道,人群攜帶率是要分人種的,歐洲人的人群攜帶率和非洲的,必然有差異。

ExAC中人群分布

ExAC中包含的同類群組


2.2三大數(shù)據(jù)庫人種構(gòu)成對比:

1、1000 Genomes:AFR: African; AMR: Ad Mixed American; EAS: East Asian; EUR: European; SAS: South Asian

2、ESP6500:AFR: African; AMR: Ad Mixed American; EAS: East Asian; EUR: European; SAS: South Asian

3、ExAC:African/African American; AMR: American; EAS: East Asian; FIN: Finnish; NFE: Non-Finnish European; SAS: South Asian; OTH: Others)

從上圖,可以看出,ExAC數(shù)據(jù)庫,60,706這個數(shù)字里面,European,也就是歐洲人占了最大比例,約4萬;對于中國人群,參考價值最大的East Asian,東亞人(日本、臺灣為主)數(shù)量最少,不到5千。


2. 搜索

網(wǎng)站首頁


2.1基本信息

顯示了基因相關(guān)信息,以及相關(guān)外部鏈接


2.2突變類型統(tǒng)計

基因突變類型統(tǒng)計,其中LoF包含:Nonsense, splice acceptor, and splice 突變。具體可以查看FAQ

  • 第一列是變異類型

  • 第二列是預期變異數(shù)目

  • 第三列是檢測到的變異數(shù)目(AF<0.0001)

  • 第四列是約束指標。對于同義和錯義,我們?yōu)橛^察到的計數(shù)與預期數(shù)量的偏差創(chuàng)建了一個帶符號的Z分數(shù)。陽性Z分表示增加的約束(對變異的不耐受),因此該基因具有比預期更少的變體。對具有比預期更多變異的基因給予負Z分數(shù)。


2.3Gene summary

箭頭1所指是突變在基因上的覆蓋率
箭頭2所指是在外顯子上的分布
箭頭3所指是CNV分布


2.4具體變異信息

第一列變異類型,第二列所在染色體,第三列染色體上的位置,第四列變異造成的氨基酸的改變情況,第四列過濾信息,第五列變異類型


2.5變異信息

點開其中的一條變異信息,可以看到,這個變異在各種人群中的突變頻率,用于基因篩選。


3.注釋

一般使用ANNOVAR進行exac注釋
table_annovar.pl ZWJ-A_indel.avinput /home/yang.zou/database/humandb_new/ -buildver hg19 -out myanno -remove -protocol refGene,snp138,1000g2014oct_eas,exac03 -operation g,f,f,f -nastring NA -outfile ZWJ-A_inde

得到突變在各種人群中的頻率。

ExAC_ALL所有人群
ExAC_AFR 非洲/非裔美國人
ExAC_AMR拉丁美洲人
ExAC_EAS東亞人
ExAC_FIN芬蘭人
ExAC_NFE非芬蘭歐洲人
ExAC_OTH 其他人群
ExAC_SAS南亞人

歡迎關(guān)注oddxix

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容