打點(diǎn)法:
是最簡單的比較兩個序列的辦法,理論上可以用紙筆完成。
如果要比較這兩個序列

我們需要把序列1整齊水平的書寫,然后把序列2整齊豎直的書寫,然后依次橫橫豎豎比較每一個位置的殘基。相同的話就在位置上打個點(diǎn)。

序列1和序列2的打點(diǎn)圖
我們可以發(fā)現(xiàn),這個矩陣中打點(diǎn)打出了一條較為明顯的對角線。
在打點(diǎn)矩陣中,連續(xù)的對角線及對角線的平行線代表兩條序列中相同的區(qū)域,這個矩陣中在主對角線位置上連續(xù)的紅色的對角線說明這個位置對應(yīng)的序列1的部分和序列2的部分是完全相同的,都是THEFA。此外,跟紅對角線平行的綠色平行線,同樣指出了序列1和序列2兩條相同的序列。也就是序列1和序列2對應(yīng)位置的TCAT,以及序列1和序列2中對應(yīng)位置的AT。由這三條線,我們找到了序列1和序列2中三條相同的子序列。最后,我們放眼全局,紅色的線和藍(lán)色的線加起來基本上構(gòu)成了一條主對角線。由此我們可以得出結(jié)論:序列1和序列2是比較相似的兩條序列。事實上,如果直接看一下兩條序列,確實是很相似的。如果是風(fēng)牛馬不相及的兩條序列,做出的打點(diǎn)矩陣中是不會出現(xiàn)對角線的,哪怕是模糊的對角線,也不會出現(xiàn)。比如讓序列1和序列3打點(diǎn)做出的打點(diǎn)圖中,完全是散點(diǎn)。

序列1和序列3的打點(diǎn)圖
還可以用一條序列自己對自己打點(diǎn)。

從而可以發(fā)現(xiàn)序列中重復(fù)的片段。這樣的打點(diǎn)矩陣必然是對稱的,并且有一條主對角線。在橫向或縱向上,與主對角線平行的短平行線所對應(yīng)的序列片段就是重復(fù)的部分。

自己與自己打點(diǎn)
用這種方法我們可以快捷的發(fā)現(xiàn)序列中的串聯(lián)重復(fù)序列以及重復(fù)的次數(shù)。
我們只要數(shù)出在半個矩陣中包括主對角線在內(nèi)的所有等距的平行線的個數(shù),就可以知道重復(fù)的次數(shù),而且最短的平行線對應(yīng)的序列就是重復(fù)單元。短的串聯(lián)復(fù)序列具有高度多態(tài)性,也就是說不同的個體間重復(fù)次數(shù)存在差異,而且這種差異在基因遺傳過程中一般遵循孟德爾共顯性遺傳規(guī)律,所以快速查找某些特定的短的串聯(lián)復(fù)序列的重復(fù)次數(shù)可以用于法醫(yī)學(xué)的個體識別或親子鑒定等領(lǐng)域。

打點(diǎn)法尋找串聯(lián)重復(fù)序列