蛋白質(zhì)序列功能域

參考教材:《生物信息學(xué)》(第二版) 樊龍江 主編

蛋白質(zhì)功能域

一條蛋白質(zhì)序列中的一段保守區(qū)域,該區(qū)域能夠獨(dú)立行使功能、進(jìn)化等。
在蛋白質(zhì)結(jié)構(gòu)中,是一個(gè)蛋白質(zhì)結(jié)構(gòu)的一部分,能形成一個(gè)緊密的三級(jí)結(jié)構(gòu),能獨(dú)立折疊且結(jié)構(gòu)穩(wěn)定,同樣具有獨(dú)立功能和進(jìn)化等特征。

功能域模型

目的:除了多序列聯(lián)配的結(jié)果,用更好的方式描述功能域并應(yīng)用。

一致序列consensus sequence

多序列聯(lián)配結(jié)果中每一列出現(xiàn)最多的堿基或氨基酸構(gòu)成的序列,是一條單一序列。

正則表達(dá)式regular expression

把每一列出現(xiàn)的堿基或氨基酸都列出而形成的。

概型profile

是一個(gè)類似PSSM的矩陣,但它可以包含匹配、錯(cuò)配、插入和缺失等情況。提供了多序列聯(lián)配中每一列出現(xiàn)各種氨基酸(或空格)的概率(經(jīng)過對(duì)數(shù)轉(zhuǎn)換并取整數(shù))。

HMM概型(隱馬爾可夫模型)

用參數(shù)表示的用于描述隨機(jī)過程統(tǒng)計(jì)特性的概率模型,是一個(gè)雙重隨機(jī)過程,由兩部分組成:馬爾可夫鏈和一般隨機(jī)過程。
詳情見書P381

熵與不確定性

信息量IC=2-H(H越大,IC越低)


公式

WechatIMG208.jpeg
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容