Melo, 2019, ‘a(chǎn)pparent’: a simple and flexible R package for accurate SNP-based parentage analysis in the absence of guiding information. 10.1186/s12859-019-2662-3
“apparent”:一個(gè)簡(jiǎn)單而靈活的R包,用于在缺乏指導(dǎo)信息的情況下進(jìn)行基于SNP的精確親子關(guān)系分析
摘要
背景
在原位自然居群和遷地遺傳資源庫中準(zhǔn)確地確定親子關(guān)系可以極大地提高植物育種/馴化的努力,并支持植物遺傳資源保護(hù)策略。雖然有一系列的親子關(guān)系分析工具可用,但是沒有一種工具能夠在完全沒有指導(dǎo)性信息的情況下,使用全基因組單核苷酸多態(tài)性(SNP)數(shù)據(jù)來推斷這種關(guān)系,例如世代、部分譜系或性別。在這里開發(fā)和呈現(xiàn)的R包(“apparent”)解決了這一差距。
結(jié)果
“apparent”采用了一種新的親子關(guān)系分析策略,基于理論預(yù)期后代(EPij)和所有潛在后代(POk)之間的遺傳一致性測(cè)試,其基因型狀態(tài)可在一對(duì)假定雙親(i和j)的所有純合位點(diǎn)上推斷,而所有潛在后代(POk)則由給定種質(zhì)集合的k個(gè)個(gè)體代表。利用Gower相異性度量(GD),EPij和POk之間的遺傳同一性被作為個(gè)體i和j是后代k的真正父母的證據(jù)。給定的三元組(親本pairij?+?offspringk)的顯著性相對(duì)于群體中所有GDij | k值的分布進(jìn)行評(píng)估。在沒有提供任何指導(dǎo)信息的情況下,在77份獼猴桃種質(zhì)的測(cè)試群體中,“apparent”正確地識(shí)別出了15個(gè)已知系譜系的親本對(duì),這一性能是其他五種常用親子分析工具無法比擬的。在由于測(cè)試群體中沒有一個(gè)親本而導(dǎo)致的不確定的三元組分析的情況下,“apparent”可以進(jìn)行后續(xù)的二元分析,以確定給定后代的可能單親。在完全沒有家系信息的情況下,二元分析的平均準(zhǔn)確率為73.3%,但在提供最小世代信息(成人與后代)時(shí),二元分析的準(zhǔn)確率提高到100%。
結(jié)論
“apparent”R軟件包是一種快速而準(zhǔn)確的親子關(guān)系分析工具,它使用全基因組的SNP數(shù)據(jù)來識(shí)別沒有家族結(jié)構(gòu)先驗(yàn)知識(shí)的群體中的親子關(guān)系。