《BSA》-生信筆記---003

背景介紹

一、什么是BSA?

BSA(Bulked Segregant Analysis)---混合分組分析法

>根據(jù)目標性狀表現(xiàn)型,對表型分離群體中的個體/株系依據(jù)目標性狀,分成性狀差異顯著的兩組

>然后將兩組的個體或株系DNA分別等量混合,形成性狀相對的DNA混合池

>再然后建庫、測序、分析的方法(根據(jù)親本間純和差異的位點,計算子代池的index值,進而挑選差異較大的位點

>可以實現(xiàn)目標性狀的基因定位

二、BSA適應的群體類型

三、BSA分析的目的

通過對極端性狀產(chǎn)生機理的研究與發(fā)展,完成家系材料單性狀基因的定位,揭示性狀相關機制,應用實際生產(chǎn)過程中, 達到育種期望,提高生產(chǎn)效益。

選擇樣本:極端親本1和2;極端子代混池1和2

主要分析的內(nèi)容:根據(jù)SNP/INDEL頻率差異分析,確定與極端性狀緊密相關的分子標記,并完成定位基因;目的基因功能注釋。

四、生物信息分析流程

1、GATK 群call--vcf

2、變異位點注釋

3、index計算

?????? ? 3.1 挑選親本間純合差異的位點

???????? 3.2 SNP-index的計算(極端親本P1為參考,分別計算兩個子代在親本間上述標記位置上的SNP-index)

?????? ???????? 候選位點:挑選極端性狀子代混池1(跟參考親本性狀相同)的SNP-index接近0,且子代2(與參考親本性狀相反)的SNPindex接近1的位點

???????? 3.3 選擇1Mb為窗口,1kb為步長,計算每個窗口中SNP-index


????????

4、目標性狀的定位

對于候選的多態(tài)性標記位點進行ANNOVAR的注釋,提取注釋結(jié)果,優(yōu)先挑選upstream或者引起stop loss或者stop gain或者非同義突變或可變剪接的位點所在的基因作為候選基因;

??????? 4.1. 外顯子上的候選位點:

?????? 4.2.nonsynonymous的位點所在基因以及upstream相關基因:

5、目標基因的定位

五、流程回顧


六、常見問題

1、簡化基因組BSA比全基因組BSA價格便宜?

答:簡化基因組技術,捕獲的基因組信息占基因組大小約1%~10%,全基因組技術,對至少25倍

2、簡化基因組測序適合做BSA性狀定位嗎?

答:針對微效多基因控制的數(shù)量性狀,與目標性狀相關的位點很多,簡化基因組或許有幸捕獲到少數(shù)位點,但絕大部分會被遺漏,這對后續(xù)的研究很不利。針對質(zhì)量性狀或由少數(shù)主效基因控制的數(shù)量性狀,簡化基因組BSA的方法風險更高。全基因組BSA性狀定位與簡化基因組BSA性狀定位見表2-1

2-1

3、子代混池的樣品個數(shù)和測序深度如何設計?為什么?

答: 2013年, James等對混池個體數(shù)和測序深度對候選基因數(shù)的影響進行了評估。下圖是評估結(jié)果,結(jié)果顯示,當子代個數(shù)超過20個,測序深度達到25x以后,候選基因個數(shù)會趨于平衡,不會有更明顯的提升效果?;谝陨衔恼陆?jīng)驗以及已完成的BSA項目經(jīng)驗,推薦20個個體進行混池,每池20×的測序深度。

4、DNA樣品如何混池?先混樣再提DNA?還是先提DNA再等量混合?

答:先提DNA再等量混合,可以減少系統(tǒng)誤差,近年發(fā)表的多數(shù)文獻都是先提DNA再等量混合。

5,能否只測親本?或者只測子代池?或者只測1個子代池?

答:分兩種情況:

1)如果研究的性狀是EMS誘導的突變性狀,可以只測兩個子代池(野生型+突變型)或者測1個親本(野生型)和1個子代池(突變型)。

2)如果研究的性狀是數(shù)量性狀,最好測2個親本和2個子代池,用一個實際在線項目評估了樣品個數(shù)對分析結(jié)果的影響,其中4個樣品的結(jié)果最好(也即2個親本+2個子代池),其次是測一個親本和兩個子代池,如果只測兩個子代池,假陽性會很高,找出來的SNP很多(下表)。


6,能否保證定位到的候選區(qū)域的大小和候選基因的個數(shù)?

答:候選區(qū)域的大小和候選基因個數(shù)的多少,與群體的大小、親本材料差異的大小、目標性狀特點、測序深度的多少、分析物種的基因組水平等多項因素相關,因此不能給出統(tǒng)一的標準,但可以參考已完成的項目經(jīng)驗進行估計。

7,沒有參考基因組的物種能否做BSA性狀定位?

答:沒有參考基因組的物種可以進行SNP頻率差異分析,可以找到侯選這段,但是無參定位效果較差,并且缺少注釋文件,獲得的結(jié)果少無參物秤一般情況不推薦做BSA性狀定位,建議嘗試遺傳圖譜等方案。

8,多倍體物種可以進行BSA性狀定位嗎?

答:有參考基因組的多倍體物種,例如: “油菜",可以用BSA進行性狀定位。

9, BSA性狀定位可以利用InDel進行定位分析嗎?

答:使用SNP標記進行定位的主要原因是SNP在基因組上的分布密度要比InDelSSR,SV,CNV等要高,使用SNP標記可以找到比較精確的區(qū)間。找到候選區(qū)間之后,可以對候選區(qū)間中的InDel和其他變異進行檢測。直接利用InDel信息進行定位缺少文獻支持,并且定位效果不如SNP效果好。

10,人工誘變只能是EMS誘變嘛?其他誘變方式得到的性狀可否采用BSA性狀定位?

答: BSA性狀定位是基于SNP,通過比較SNP頻率差異進行分析的, EMS誘發(fā)的是點突變,所以EMS誘發(fā)的突變適合這種分析方式;其他的誘變方式誘發(fā)的大部分是結(jié)構變異,在SNP水平上可能找不到導致目標性狀差異的區(qū)域,所以不適合SNP頻率分析的方法。

11,全基因組(WGS ) BSA性狀定位與轉(zhuǎn)錄組(RNAseq )進行性狀定位的比較。

答: 2013年,Henke等總結(jié)了全基因組BSA相比轉(zhuǎn)錄組( RNAseg進行性狀定位的優(yōu)點

1)覆蓋范圍:全基因組BSA可以覆蓋整個基因組, 98%的編碼區(qū)可以覆蓋到。而RNAseq只對編碼區(qū)進行測序。

2)基因檢測的偏好性:全基因組BSA對基因的檢測較均勻,無偏好性,不受時間或者組織的影響。RNAseq偏向于在特定時間或者組織中高表達的基因。

3)區(qū)域偏好性:基因分布不均勻,若一些區(qū)域基因密度低,用RNAseq可能漏掉。

4)多態(tài)性:基因組的多態(tài)性多數(shù)位于非編碼區(qū),采用RNAseq檢測到的多態(tài)牲較低,只有少數(shù)與突變位點連鎖的多態(tài)性標記能被RNAseq檢測到。

因此,采用全基因組BSA更容易檢測到與目標基因連鎖的多態(tài)性標記。

后續(xù)更新。。。。。


QTL-seq(數(shù)量性狀)

MutMap(點突變性狀)

InDel-seq(InDel突變性狀)

轉(zhuǎn)錄組BSA

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • 劉小澤寫于18.7.18表型與基因型相關聯(lián)(基因定位)是遺傳學上的重要問題。 什么是重測序Resequencing...
    劉小澤閱讀 23,749評論 5 47
  • 1.混合測序基礎 測序成本雖然下降了,但對于植物育種應用研究來說還是很高,動不動就上百群體,小小植物個體價值又低,...
    生物信息與育種閱讀 14,923評論 0 10
  • BSA(Bulked Segregant Analysis),集群分離分析或分離群體分組分析法。兩個特點:1. 混...
    楊亮_SAAS閱讀 26,197評論 1 42
  • BSA(Bulk Segregant Analysis) 針對目標性狀,選擇表型極端差異的親本構建家系,對該家系目...
    假裝_學霸閱讀 8,613評論 2 11
  • 1 原理 詳細信息參見2013年的QTL-seq 文獻,這里只做簡單介紹。 1.1 群體構建 QTL-seq 將 ...
    靜絢閱讀 27,798評論 1 30

友情鏈接更多精彩內(nèi)容