輸入兩個(gè)親本基因組,輸出變異位點(diǎn),快速開發(fā)分子標(biāo)記引物

寫在前面

「育種」是目前大多關(guān)心的事情。雜交育種仍然是目前最為常用的育種手段。任何方法創(chuàng)新的優(yōu)異材料,下一步都可能應(yīng)用于雜交育種。反過來,「基因定位」則是基于雜交群體,開發(fā)分子標(biāo)記,定位到關(guān)鍵性狀的關(guān)聯(lián)區(qū)間,并試圖確定Casual Variants。兩者都會(huì)涉及到兩個(gè)親本和他們的子代。當(dāng)我們有兩個(gè)親本的基因組序列時(shí),完全可以基于這兩個(gè)序列,直接確定差異位點(diǎn),進(jìn)而相對(duì)有方向的設(shè)計(jì)引物,用于快速定位,更或者,鑒定雜種后代。相對(duì)于簡單的單個(gè)物種基因組序列鑒定 SSR,隨后設(shè)計(jì)引物。這一操作,顯得更為高效且靠譜。
當(dāng)然,事實(shí)上,這個(gè)需求黎老板早前也有與我提到,對(duì)應(yīng)的,那么這個(gè)需求在「作物學(xué)」相關(guān)科研工作,必然是存在且重要。于是,有了今天這個(gè)插件「Genome VarScan」。

插件簡介

「Genome VarScan」只需要用戶輸入兩個(gè)基因組序列文件,設(shè)置一個(gè)輸出目錄,點(diǎn)擊「Start」,等待即可。邏輯上,對(duì)于水稻,我這邊只需要不到10分鐘。


直接上示例

大概 10 分鐘搞定。
輸出文件如下

對(duì)于其中的paf文件,可以直接用 TBtools 的 Paf Viz 功能查看

但是事實(shí)上,我會(huì)更關(guān)心下面這個(gè)文件

雖然比較大,但是信息比較全,默認(rèn)輸出是包括所有 SNP,考慮限制變異位點(diǎn)的寬度為大于0,也就是至少是1bp長度變化,那么就只有插入缺失。

可以看到這是一個(gè)大片段的缺失

當(dāng)然,很多時(shí)候,我們最喜歡的還是大于30bp,但是又小于200bp的變異位點(diǎn),那么我會(huì)建議,用這個(gè)
image.png

如此,我們會(huì)得到一個(gè)相對(duì)較小的文件。

當(dāng)我們得到這個(gè)文件,那么其實(shí)接下來的事情就比較簡單:


  1. 簡單篩選一下,保留感興趣的行
  2. 使用「Batch Target Region Primer Design」,使用參考基因組序列進(jìn)行批量引物設(shè)計(jì)
  3. 使用「Primer Check」分別對(duì)兩個(gè)物種進(jìn)行批量引物篩選,找到材料內(nèi)特異的位點(diǎn)
  4. 簡單比較統(tǒng)一引物在不同材料中是否確實(shí)有長度差異
  5. 用于實(shí)驗(yàn)驗(yàn)證
  6. 用于選育種

大體如下,首先是批量引物設(shè)計(jì)




復(fù)制引物之后轉(zhuǎn)換成 Fasta 格式,檢測在一個(gè)材料中的特異性



可以同時(shí)檢測在另一個(gè)材料中的特異性

一共是 5000對(duì) 引物左右,所以咱們就慢慢先等著結(jié)果。估計(jì)至少要等上一段時(shí)間吧。具體沒測試。建議過夜培養(yǎng)。晚上沒吃飯,剛才去吃了宵夜回來。沒想到就過了12點(diǎn)。似乎還是跑了很久,必須過夜培養(yǎng)了。也罷,只選幾個(gè)引物看看。

隨便選兩對(duì)引物,都可以直接用于跑標(biāo)記....


寫在最后

很多時(shí)候,你只需要知道自己在干什么就行。其他人常常只能看到他們能看到的東西,而你不一樣。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容