參考教材:《生物信息學(xué)》(第二版) 樊龍江 主編
蛋白質(zhì)功能域
一條蛋白質(zhì)序列中的一段保守區(qū)域,該區(qū)域能夠獨(dú)立行使功能、進(jìn)化等。
在蛋白質(zhì)結(jié)構(gòu)中,是一個(gè)蛋白質(zhì)結(jié)構(gòu)的一部分,能形成一個(gè)緊密的三級(jí)結(jié)構(gòu),能獨(dú)立折疊且結(jié)構(gòu)穩(wěn)定,同樣具有獨(dú)立功能和進(jìn)化等特征。
功能域模型
目的:除了多序列聯(lián)配的結(jié)果,用更好的方式描述功能域并應(yīng)用。
一致序列consensus sequence
多序列聯(lián)配結(jié)果中每一列出現(xiàn)最多的堿基或氨基酸構(gòu)成的序列,是一條單一序列。
正則表達(dá)式regular expression
把每一列出現(xiàn)的堿基或氨基酸都列出而形成的。
概型profile
是一個(gè)類似PSSM的矩陣,但它可以包含匹配、錯(cuò)配、插入和缺失等情況。提供了多序列聯(lián)配中每一列出現(xiàn)各種氨基酸(或空格)的概率(經(jīng)過對(duì)數(shù)轉(zhuǎn)換并取整數(shù))。
HMM概型(隱馬爾可夫模型)
用參數(shù)表示的用于描述隨機(jī)過程統(tǒng)計(jì)特性的概率模型,是一個(gè)雙重隨機(jī)過程,由兩部分組成:馬爾可夫鏈和一般隨機(jī)過程。
詳情見書P381
熵與不確定性
信息量IC=2-H(H越大,IC越低)

公式

WechatIMG208.jpeg