每日paper - 20211229 - startmrca 推斷有利等位基因的 allele age(二)

Estimating Time to the Common Ancestor for a Beneficial Allele

2018 年發(fā)表在 Molecular Biology and Evolution 上。第一作者與通訊作者為芝加哥大學(xué) Department of Ecology and Evolution 的 Joel Smith。

接上篇:每日paper - 20211207 - smartmrca 推斷有利等位基因的 allele age(一)

研究者們開(kāi)發(fā)的這一模型根據(jù)已有的樣品推算有利變異的最近共同祖先 TMRCA。對(duì)于有利突變,往回追溯,會(huì)發(fā)現(xiàn)其頻率的下降與選擇強(qiáng)度是成比例的;不同的攜帶該有利突變的單倍型往回追溯,最終會(huì) coalescent。這對(duì)于初始個(gè)體數(shù)目少的群體的增長(zhǎng)也是同樣的道理。

因此,受選擇位點(diǎn)的群體歷史往往是 “star-shaped”,就可以近似認(rèn)為,在選擇作用強(qiáng)時(shí),lineages 之間是相互獨(dú)立的。但是這里也有一個(gè)需要強(qiáng)調(diào)的前提,就是有利等位基因出現(xiàn)后就立即受到選擇,否則就會(huì)存在多個(gè)祖先單倍型、譜系歷史不是 star-shaped。

將關(guān)注位點(diǎn)的上下游區(qū)域分開(kāi)來(lái)考慮。

經(jīng)推導(dǎo)得公式:

對(duì)模擬數(shù)據(jù)的測(cè)試顯示,在選擇作用強(qiáng)、選擇的 reference panel 與待檢測(cè)群體的分化程度合適時(shí),模型的準(zhǔn)確率高。有利變異的頻率對(duì)結(jié)果的影響不是很大,在頻率低時(shí)略微地更準(zhǔn)確一些。如果選擇的外群與待檢測(cè)群體的分化程度過(guò)高,會(huì)高估 TMRCA。

文中的 reference panel 分化時(shí)間 N 和 0.5N 分別近似于 Fst 0.4 和 0.2。

除了 reference panel 的分化時(shí)間以外,還存在另一個(gè)可能的 bias 的來(lái)源。一些重組事件可能并不能被觀察到,因?yàn)楫?dāng)有利等位基因頻率上升后,一些重組事件可能并不會(huì)導(dǎo)致 ancestral 和 background 之間的 transition(background 指的是有利等位基因攜帶的單倍型,ancestral 指的是沒(méi)有有利等位基因的單倍型)。一個(gè)可能的解決方案是將基于頻率的替換可能性考慮進(jìn)來(lái)(Chen at al., 2015)。

模型假設(shè)所有單倍型的進(jìn)化歷史是相互獨(dú)立的,在樣品量過(guò)大、TMRCA 較為久遠(yuǎn)、以及有利變異出現(xiàn)后經(jīng)歷了一段時(shí)間才開(kāi)始受到選擇作用的情況下,這個(gè)假設(shè)往往是不成立的。

對(duì)變異和重組率的正確的判斷對(duì)于模型的準(zhǔn)確性有非常大的影響。在沒(méi)有可用的 fine-scale 重組圖譜的情況下,建議使用研究區(qū)域的 uniform 重組率。選擇合適的突變率也很重要。

startmrca 的 github 網(wǎng)址?https://github.com/jhavsmith/startmrca

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容