蛋白質(zhì)序列的替換記分矩陣

1.等價(jià)矩陣:

與DNA等價(jià)矩陣的道理相同,相同氨基酸之間的匹配得分為1,不同氨基酸間的替換得分為0。在實(shí)際的序列比對中較少使用。

2.PAM矩陣:

PAM矩陣基于進(jìn)化原理。如果兩種氨基酸替換頻繁,說明自然界容易接受這種替換,那么這對氨基酸替換得分就應(yīng)該高。PAM矩陣是目前蛋白質(zhì)序列比較中最廣泛使用的記分方法之一,基礎(chǔ)的PAM-1矩陣反應(yīng)的是進(jìn)化產(chǎn)生的每一百個(gè)氨基酸平均發(fā)生一個(gè)突變的量值。PAM-1自乘n次,可得到PAM-n,即發(fā)生了更多次突變。

3.BLOSUM矩陣:

BLOSUM矩陣是通過關(guān)系比較遠(yuǎn)的序列來獲得矩陣元素的。PAM-1矩陣的產(chǎn)生是基于相似度高(>85%)的序列比對,那些進(jìn)化距離較遠(yuǎn)的矩陣,如PAM-250,是通過PAM-1自乘得到的。即,BLOSUM矩陣的相似度是根據(jù)真實(shí)數(shù)據(jù)產(chǎn)生的,而PAM矩陣是通過矩陣自乘外推而來的。和PAM矩陣一樣,BLOSUM矩陣也有不同的編號(hào),如BLOSUM-80,BLOSUM-62。80代表該矩陣是由一致度≥80%的序列計(jì)算而來,同理,62是指該矩陣是由一致度≥62%的序列計(jì)算而來。


現(xiàn)在我們總結(jié)一下到底是選 PAM-幾或 BLOSUM-幾?


但是PAM并不是幾號(hào)都有,例如氨基酸差異為80%時(shí),要選PAM-246,但是并沒有,所以選擇PAM-250。

對于關(guān)系較遠(yuǎn)的序列之間的比較,由于PAM-250是推算而來,所以準(zhǔn)確度受到一定限制,BLOSUM-45更具優(yōu)勢。對于關(guān)系較近的序列之間的比較,用PAM或BLOSUM矩陣做出的比對結(jié)果差別不大。

最常用的BLOSUM-62

4.遺傳密碼矩陣:

遺傳密碼矩陣通過計(jì)算一個(gè)氨基酸轉(zhuǎn)換成另一個(gè)氨基酸所需的密碼子變化的數(shù)目得到的,矩陣的值對應(yīng)為據(jù)此付出的代價(jià)。如果變化一個(gè)堿基就可以是一個(gè)氨基酸的密碼子轉(zhuǎn)換為另一個(gè)氨基酸的密碼子,則這兩個(gè)氨基酸的替換代價(jià)為1 ; 如果需要2個(gè)堿基的改變,則替換代價(jià)為2 ; 再比如從Met到Tyr三個(gè)密碼子都要變,則代價(jià)為3.
遺傳密碼矩陣常用進(jìn)化距離的計(jì)算,其優(yōu)點(diǎn)是計(jì)算結(jié)果可以直接用于繪制進(jìn)化樹,但是在蛋白質(zhì)序列比對中,尤其是相似度很低的序列比對中,很少被使用。


遺傳密碼矩陣

5.疏水矩陣:

根據(jù)氨基酸殘基替換前后疏水性的變化而得到得分矩陣。若一次氨基酸替換疏水性不發(fā)生太大變化,這種替換得分高,否則替換得分低。該矩陣物理意義明確,有一定的理化性質(zhì)依據(jù),適用于偏重蛋白質(zhì)功能方面的序列比對。在這個(gè)矩陣?yán)铮被岚凑沼H疏水性排列,前面是親水性,后面是疏水性。


疏水矩陣

有了替換記分矩陣,就可以知道哪些氨基酸是相似的。

例如:


我們可以從BLOSUM-62中讀出,L和I 相似,K和L不相似。則:一致度=2/4=50%
相似度=(2+1)/4=75%

如果兩個(gè)序列的長度不相同,怎么計(jì)算一致度與相似度?


需要先系統(tǒng)的學(xué)習(xí)比較兩個(gè)序列的方法。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容