(史上最全)SNP位點與轉錄因子結合特異性數(shù)據(jù)庫:GVATdb

眾所周知,全基因組關聯(lián)分析(GWAS)發(fā)現(xiàn)的很多變異位點基本為非編碼,這些變異位點1)要么調(diào)控基因表達(eQTL); 2)要么影響增強子活性; 3)要么影響轉錄因子(TF)結合特異性; 4)要么啥也不是。

針對以上四種情況:

1)是否調(diào)控基因表達(eQTL)可通過GTExhttps://gtexportal.org/home/)查詢。

2)是否影響增強子活性可通過之前的推文查詢:感興趣的SNP/區(qū)域上是否有增強子/轉錄因子?增強子/轉錄因子調(diào)控哪個靶基因?(EnhancerDB)

3)是否影響轉錄因子(TF)結合特異性則可通過今天介紹的數(shù)據(jù)庫進行查詢:GVATdbhttp://renlab.sdsc.edu/GVATdb/search.html

上周Nature發(fā)了一篇文獻Systematic analysis of binding of transcription factors to noncoding variants

該文獻針對95,886個常見變異位點(SNPs,歐洲和亞洲人群的MAF> 1%)與270個轉錄因子的結合特異性進行了大量的SNP-SELEX實驗,并以此構建了GVATdb數(shù)據(jù)庫。

下圖是針對轉錄因子或者SNP位點進行檢索的實驗結果圖:

image

每列的釋義如下:

oligo_auc:轉錄因子與40bp DNA 序列的結合得分, 用AUC(Area under Curve)值表示;

oligo_pval:對OBS進行25,000次蒙特卡洛隨機化后得到的p值。p<0.05表示TF與基因組片段的特異性“結合”;

Alt:SNP(hg19)的替代等位基因;

Ref:SNP(hg19)的參考等位基因;

ref_auc:ref 與 TF 的結合得分;

alt_auc:alt 與 TF 的結合得分;

pbs:結合傾向性得分,公式為:Ref 等位基因得分減去 Alt 等位基因得分,負值表示轉錄因子更傾向于結合 Alt 等位基因;

p-value:對 PBS 進行25,000次蒙特卡洛隨機化后得到的 p 值。 p<0.01 表示 TF 與 Ref 等位基因和 Alt 等位基因結合“存在差異”。

此外,對于沒有納入 SNP-SELEX 實驗的 SNP 位點,作者還建立了 deltaSVM 模型,用于預測未納入的 SNP 位點與 TF 的結合特異性,如下圖所示:

image

參考文獻:Yan J, Qiu Y, Dos Santos A M R, et al. Systematic analysis of binding of transcription factors to noncoding variants[J]. Nature, 2021: 1-5.


由于這個網(wǎng)站相當簡單易懂,本次推文就不多介紹啦,祝各位周末愉快~


?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容