寫在前面
那天夏老師突然給我了一個電話,大體是提了這么一個想法,亦即,「BLAST Zone」挺好的,但如果可以加上「One Step ML Tree」似乎就更好了。當(dāng)然,這個事情其實不是沒想過。主要還是涉及到一個多庫檢索,路徑解決以及一些調(diào)整起來相對麻煩的事情。
于是也就不了了之了。不過,今晚我還是花了時間,把這個功能實現(xiàn)了。至于為什么?因為心情確實不好,今天一天心情都不怎樣。來來去去,也只能謝謝代碼來放松下子了。
回到主題,其實,這個功能,似乎不需要說明。
BLAST+建樹

隨后,等就完事了。注意到,其中可以指定使用 BLAST 結(jié)果的前多少個序列拿來建樹,大體如下

多條序列
當(dāng)然,我們可以輸入多條序列,BLAST 然后建樹。需要注意的是,重復(fù)的 HIT ID 當(dāng)然會被去冗余。這個或許可以拿來簡單看看輸入的兩個序列是不是在一個家族的同一小分支?當(dāng)然我沒想過要做多復(fù)雜的情況,畢竟有時候我們要考慮總序列如果太多,建樹會慢了點。

多個數(shù)據(jù)庫
如果只是一個BLAST數(shù)據(jù)庫,那么其實平平無奇。有時候,我們是希望知道一個基因在多個物種中的同源基因是哪些,然后我們建個樹,看看情況。

這里我們同時選擇了擬南芥和水稻兩個蛋白序列庫,等到BLAST結(jié)果。注意到,實現(xiàn)邏輯是,每個庫分別BLAST,然后整合比對結(jié)果。于是 Top 10 就會變成水稻 10 個 ,擬南芥 10 個。彈出的圖稿如下

當(dāng)然,有時候,我覺得其實如果輸入一個基因,那么對應(yīng)出來 Top 5 就差不多了,不需要 Top 10。
突然想起來,大家都在說 荔枝的 SVP 擴張了。然后呢,NG文稿也說了。那么其實我們可以看看的。隨便到 TAIR 上找了一個 SVP,也不知道是不是就是,反正不管了。

然后,我們可以得到這棵樹

果然,還是擴張了。從基因ID來看,是一串 SVP。
寫在最后
Emmm,好,也到了下班時間了。今晚算是摸魚了兩個多小時。