背景介紹

一、什么是BSA?
BSA(Bulked Segregant Analysis)---混合分組分析法
>根據(jù)目標性狀表現(xiàn)型,對表型分離群體中的個體/株系依據(jù)目標性狀,分成性狀差異顯著的兩組
>然后將兩組的個體或株系DNA分別等量混合,形成性狀相對的DNA混合池。
>再然后建庫、測序、分析的方法(根據(jù)親本間純和差異的位點,計算子代池的index值,進而挑選差異較大的位點
>可以實現(xiàn)目標性狀的基因定位
二、BSA適應的群體類型

三、BSA分析的目的
通過對極端性狀產(chǎn)生機理的研究與發(fā)展,完成家系材料單性狀基因的定位,揭示性狀相關機制,應用實際生產(chǎn)過程中, 達到育種期望,提高生產(chǎn)效益。
選擇樣本:極端親本1和2;極端子代混池1和2
主要分析的內(nèi)容:根據(jù)SNP/INDEL頻率差異分析,確定與極端性狀緊密相關的分子標記,并完成定位基因;目的基因功能注釋。
四、生物信息分析流程

1、GATK 群call--vcf
2、變異位點注釋
3、index計算
?????? ? 3.1 挑選親本間純合差異的位點
???????? 3.2 SNP-index的計算(極端親本P1為參考,分別計算兩個子代在親本間上述標記位置上的SNP-index)
?????? ???????? 候選位點:挑選極端性狀子代混池1(跟參考親本性狀相同)的SNP-index接近0,且子代2(與參考親本性狀相反)的SNPindex接近1的位點
???????? 3.3 選擇1Mb為窗口,1kb為步長,計算每個窗口中SNP-index

????????

4、目標性狀的定位
對于候選的多態(tài)性標記位點進行ANNOVAR的注釋,提取注釋結(jié)果,優(yōu)先挑選upstream或者引起stop loss或者stop gain或者非同義突變或可變剪接的位點所在的基因作為候選基因;
??????? 4.1. 外顯子上的候選位點:
?????? 4.2.nonsynonymous的位點所在基因以及upstream相關基因:
5、目標基因的定位
五、流程回顧

六、常見問題
1、簡化基因組BSA比全基因組BSA價格便宜?
答:簡化基因組技術,捕獲的基因組信息占基因組大小約1%~10%,全基因組技術,對至少25倍
2、簡化基因組測序適合做BSA性狀定位嗎?
答:針對微效多基因控制的數(shù)量性狀,與目標性狀相關的位點很多,簡化基因組或許有幸捕獲到少數(shù)位點,但絕大部分會被遺漏,這對后續(xù)的研究很不利。針對質(zhì)量性狀或由少數(shù)主效基因控制的數(shù)量性狀,簡化基因組BSA的方法風險更高。全基因組BSA性狀定位與簡化基因組BSA性狀定位見表2-1

3、子代混池的樣品個數(shù)和測序深度如何設計?為什么?
答: 2013年, James等對混池個體數(shù)和測序深度對候選基因數(shù)的影響進行了評估。下圖是評估結(jié)果,結(jié)果顯示,當子代個數(shù)超過20個,測序深度達到25x以后,候選基因個數(shù)會趨于平衡,不會有更明顯的提升效果?;谝陨衔恼陆?jīng)驗以及已完成的BSA項目經(jīng)驗,推薦20個個體進行混池,每池20×的測序深度。

4、DNA樣品如何混池?先混樣再提DNA?還是先提DNA再等量混合?
答:先提DNA再等量混合,可以減少系統(tǒng)誤差,近年發(fā)表的多數(shù)文獻都是先提DNA再等量混合。
5,能否只測親本?或者只測子代池?或者只測1個子代池?
答:分兩種情況:
1)如果研究的性狀是EMS誘導的突變性狀,可以只測兩個子代池(野生型+突變型)或者測1個親本(野生型)和1個子代池(突變型)。
2)如果研究的性狀是數(shù)量性狀,最好測2個親本和2個子代池,用一個實際在線項目評估了樣品個數(shù)對分析結(jié)果的影響,其中4個樣品的結(jié)果最好(也即2個親本+2個子代池),其次是測一個親本和兩個子代池,如果只測兩個子代池,假陽性會很高,找出來的SNP很多(下表)。

6,能否保證定位到的候選區(qū)域的大小和候選基因的個數(shù)?
答:候選區(qū)域的大小和候選基因個數(shù)的多少,與群體的大小、親本材料差異的大小、目標性狀特點、測序深度的多少、分析物種的基因組水平等多項因素相關,因此不能給出統(tǒng)一的標準,但可以參考已完成的項目經(jīng)驗進行估計。
7,沒有參考基因組的物種能否做BSA性狀定位?
答:沒有參考基因組的物種可以進行SNP頻率差異分析,可以找到侯選這段,但是無參定位效果較差,并且缺少注釋文件,獲得的結(jié)果少無參物秤一般情況不推薦做BSA性狀定位,建議嘗試遺傳圖譜等方案。
8,多倍體物種可以進行BSA性狀定位嗎?
答:有參考基因組的多倍體物種,例如: “油菜",可以用BSA進行性狀定位。
9, BSA性狀定位可以利用InDel進行定位分析嗎?
答:使用SNP標記進行定位的主要原因是SNP在基因組上的分布密度要比InDelSSR,SV,CNV等要高,使用SNP標記可以找到比較精確的區(qū)間。找到候選區(qū)間之后,可以對候選區(qū)間中的InDel和其他變異進行檢測。直接利用InDel信息進行定位缺少文獻支持,并且定位效果不如SNP效果好。
10,人工誘變只能是EMS誘變嘛?其他誘變方式得到的性狀可否采用BSA性狀定位?
答: BSA性狀定位是基于SNP,通過比較SNP頻率差異進行分析的, EMS誘發(fā)的是點突變,所以EMS誘發(fā)的突變適合這種分析方式;其他的誘變方式誘發(fā)的大部分是結(jié)構變異,在SNP水平上可能找不到導致目標性狀差異的區(qū)域,所以不適合SNP頻率分析的方法。
11,全基因組(WGS ) BSA性狀定位與轉(zhuǎn)錄組(RNAseq )進行性狀定位的比較。
答: 2013年,Henke等總結(jié)了全基因組BSA相比轉(zhuǎn)錄組( RNAseg進行性狀定位的優(yōu)點
1)覆蓋范圍:全基因組BSA可以覆蓋整個基因組, 98%的編碼區(qū)可以覆蓋到。而RNAseq只對編碼區(qū)進行測序。
2)基因檢測的偏好性:全基因組BSA對基因的檢測較均勻,無偏好性,不受時間或者組織的影響。RNAseq偏向于在特定時間或者組織中高表達的基因。
3)區(qū)域偏好性:基因分布不均勻,若一些區(qū)域基因密度低,用RNAseq可能漏掉。
4)多態(tài)性:基因組的多態(tài)性多數(shù)位于非編碼區(qū),采用RNAseq檢測到的多態(tài)牲較低,只有少數(shù)與突變位點連鎖的多態(tài)性標記能被RNAseq檢測到。
因此,采用全基因組BSA更容易檢測到與目標基因連鎖的多態(tài)性標記。
后續(xù)更新。。。。。
QTL-seq(數(shù)量性狀)
MutMap(點突變性狀)
InDel-seq(InDel突變性狀)
轉(zhuǎn)錄組BSA