簡介:混池測序分析(Bulked segregant analysis)是一種省時省力、廣泛應(yīng)用于挖掘性狀遺傳位點(diǎn)的方法,已有多種相應(yīng)算法被開發(fā)出來。包括基于高低池等位基因頻率差異的ΔSNP-index方法,基于歐式距離的
方法,基于G值計算的G’方法,基于LOD值計算的SmoothLOD方法以及基于非參數(shù)檢驗(yàn)的Ridit方法等。這些方法缺乏用戶友好型軟件,從而使用復(fù)雜;同時大多只適用于兩個混池,且難以檢測復(fù)雜性狀和背景下的微效位點(diǎn)。
DeepBSA是2022年8月在雜志Molecular Plant上發(fā)表的利用深度學(xué)習(xí)進(jìn)行功能基因定位的混池測序新算法。作者將開發(fā)的新算法和五種廣泛使用的算法集成為一個軟件,包括數(shù)據(jù)預(yù)處理、功能位點(diǎn)定位以及模擬數(shù)據(jù)生成等功能。同時開發(fā)出一個用戶友好的操作界面,通過簡單操作可以快速獲得定位的圖表,還可以比較不同方法的結(jié)果差異。

文章引用:Li Z., Chen X., Shi S., Zhang H., Wang X., Chen H., Li W., and Li L. (2022). DeepBSA: A deep-learning algorithm improves bulked segregant analysis for dissecting complex traits. Mol. Plant. doi: https://doi.org/10.1016/j.molp.2022.08.004.
軟件地址:http://zeasystemsbio.hzau.edu.cn/tools.html,? 目前更新到v1.4,且分別提供Windows版本和Linux版本,相應(yīng)使用步驟在 github (https://github.com/lizhao007/DeepBSA)上也有說明。操作手冊附在最后。
目前筆者收到的反饋報錯基本都是輸入VCF文件格式不對造成的,特強(qiáng)調(diào)以下幾點(diǎn):
1、VCF文件中的SNP只保留染色體的,不要Contig或Scafflod上的,不然軟件識別“染色體”太多,會閃退。
2、VCF文件中不要保留親本列的信息,只需要混池列的信息。
3、VCF文件有多個混池時,應(yīng)該安裝表型順序排列;除了DL和ridit這兩個能識別多個池的方法會用到所有池信息,其它方法只會用到最高和最低池的信息。
4、VCF文件可以有#注釋行,CSV文件不可以有。
5、多等位基因的位點(diǎn)軟件不識別,需要去掉。
6、進(jìn)一步維護(hù)的只有Windows版本,建議使用這個版本。
結(jié)果文件包括定位圖(PNG和PDF)、定位區(qū)間以及每個SNP的方法值(可以自己進(jìn)一步作圖),如下:


