比較兩個序列的方法

打點(diǎn)法:

是最簡單的比較兩個序列的辦法,理論上可以用紙筆完成。

如果要比較這兩個序列


我們需要把序列1整齊水平的書寫,然后把序列2整齊豎直的書寫,然后依次橫橫豎豎比較每一個位置的殘基。相同的話就在位置上打個點(diǎn)。
序列1和序列2的打點(diǎn)圖

我們可以發(fā)現(xiàn),這個矩陣中打點(diǎn)打出了一條較為明顯的對角線。
在打點(diǎn)矩陣中,連續(xù)的對角線及對角線的平行線代表兩條序列中相同的區(qū)域,這個矩陣中在主對角線位置上連續(xù)的紅色的對角線說明這個位置對應(yīng)的序列1的部分和序列2的部分是完全相同的,都是THEFA。此外,跟紅對角線平行的綠色平行線,同樣指出了序列1和序列2兩條相同的序列。也就是序列1和序列2對應(yīng)位置的TCAT,以及序列1和序列2中對應(yīng)位置的AT。由這三條線,我們找到了序列1和序列2中三條相同的子序列。最后,我們放眼全局,紅色的線和藍(lán)色的線加起來基本上構(gòu)成了一條主對角線。由此我們可以得出結(jié)論:序列1和序列2是比較相似的兩條序列。事實上,如果直接看一下兩條序列,確實是很相似的。如果是風(fēng)牛馬不相及的兩條序列,做出的打點(diǎn)矩陣中是不會出現(xiàn)對角線的,哪怕是模糊的對角線,也不會出現(xiàn)。比如讓序列1和序列3打點(diǎn)做出的打點(diǎn)圖中,完全是散點(diǎn)。
序列1和序列3的打點(diǎn)圖

還可以用一條序列自己對自己打點(diǎn)。

從而可以發(fā)現(xiàn)序列中重復(fù)的片段。這樣的打點(diǎn)矩陣必然是對稱的,并且有一條主對角線。在橫向或縱向上,與主對角線平行的短平行線所對應(yīng)的序列片段就是重復(fù)的部分。


自己與自己打點(diǎn)

用這種方法我們可以快捷的發(fā)現(xiàn)序列中的串聯(lián)重復(fù)序列以及重復(fù)的次數(shù)。

我們只要數(shù)出在半個矩陣中包括主對角線在內(nèi)的所有等距的平行線的個數(shù),就可以知道重復(fù)的次數(shù),而且最短的平行線對應(yīng)的序列就是重復(fù)單元。短的串聯(lián)復(fù)序列具有高度多態(tài)性,也就是說不同的個體間重復(fù)次數(shù)存在差異,而且這種差異在基因遺傳過程中一般遵循孟德爾共顯性遺傳規(guī)律,所以快速查找某些特定的短的串聯(lián)復(fù)序列的重復(fù)次數(shù)可以用于法醫(yī)學(xué)的個體識別或親子鑒定等領(lǐng)域。

打點(diǎn)法尋找串聯(lián)重復(fù)序列

打點(diǎn)法在線軟件:Dotlet

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容