DeepBSA的使用介紹

簡介:混池測序分析(Bulked segregant analysis)是一種省時省力、廣泛應(yīng)用于挖掘性狀遺傳位點(diǎn)的方法,已有多種相應(yīng)算法被開發(fā)出來。包括基于高低池等位基因頻率差異的ΔSNP-index方法,基于歐式距離的ED^4方法,基于G值計算的G’方法,基于LOD值計算的SmoothLOD方法以及基于非參數(shù)檢驗(yàn)的Ridit方法等。這些方法缺乏用戶友好型軟件,從而使用復(fù)雜;同時大多只適用于兩個混池,且難以檢測復(fù)雜性狀和背景下的微效位點(diǎn)。

DeepBSA是2022年8月在雜志Molecular Plant上發(fā)表的利用深度學(xué)習(xí)進(jìn)行功能基因定位的混池測序新算法。作者將開發(fā)的新算法和五種廣泛使用的算法集成為一個軟件,包括數(shù)據(jù)預(yù)處理、功能位點(diǎn)定位以及模擬數(shù)據(jù)生成等功能。同時開發(fā)出一個用戶友好的操作界面,通過簡單操作可以快速獲得定位的圖表,還可以比較不同方法的結(jié)果差異。

DeepBSA流程及操作界面

文章引用:Li Z., Chen X., Shi S., Zhang H., Wang X., Chen H., Li W., and Li L. (2022). DeepBSA: A deep-learning algorithm improves bulked segregant analysis for dissecting complex traits. Mol. Plant. doi: https://doi.org/10.1016/j.molp.2022.08.004.

軟件地址:http://zeasystemsbio.hzau.edu.cn/tools.html,? 目前更新到v1.4,且分別提供Windows版本和Linux版本,相應(yīng)使用步驟在 github (https://github.com/lizhao007/DeepBSA)上也有說明。操作手冊附在最后。

目前筆者收到的反饋報錯基本都是輸入VCF文件格式不對造成的,特強(qiáng)調(diào)以下幾點(diǎn):

1、VCF文件中的SNP只保留染色體的,不要Contig或Scafflod上的,不然軟件識別“染色體”太多,會閃退。

2、VCF文件中不要保留親本列的信息,只需要混池列的信息。

3、VCF文件有多個混池時,應(yīng)該安裝表型順序排列;除了DL和ridit這兩個能識別多個池的方法會用到所有池信息,其它方法只會用到最高和最低池的信息。

4、VCF文件可以有#注釋行,CSV文件不可以有。

5、多等位基因的位點(diǎn)軟件不識別,需要去掉。

6、進(jìn)一步維護(hù)的只有Windows版本,建議使用這個版本。

結(jié)果文件包括定位圖(PNG和PDF)、定位區(qū)間以及每個SNP的方法值(可以自己進(jìn)一步作圖),如下:



最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容