0?? 序列比對(duì)的概念

序列比對(duì)和序列特征分析總目錄

序列比對(duì)的根本是發(fā)現(xiàn)潛在的同源序列,為所查詢的序列進(jìn)行功能預(yù)測(cè)及三維結(jié)構(gòu)建模奠定基礎(chǔ)。

序列比對(duì)sequence alignment

概念:運(yùn)用某種特定的數(shù)學(xué)模型或算法,找出兩個(gè)(雙序列比對(duì))或多個(gè)序列(多序列比對(duì))之間的最大匹配堿基或殘基數(shù),比對(duì)的結(jié)果反應(yīng)算法在多大程度上提供序列之間的相似性關(guān)系及生物學(xué)特性。
目的: 通過對(duì)比不同物種序列的相似性判斷他們沒之間是否具有同源性。通過比較兩個(gè)序列之間的相似區(qū)域和保守型位點(diǎn),可以尋找兩者之間的分子進(jìn)化關(guān)系。
進(jìn)一步比對(duì)將多個(gè)蛋白質(zhì)和核酸同時(shí)進(jìn)行比較,尋找這些有進(jìn)化關(guān)系的序列之間共同的保守區(qū)域,位點(diǎn)和模式,從而探索導(dǎo)致它們產(chǎn)生共同功能的序列模式。
此外,蛋白質(zhì)與具有三維結(jié)構(gòu)的蛋白質(zhì)比較可以獲得蛋白質(zhì)結(jié)構(gòu)和折疊類型的信息。

相似性similarity和同源性homology是序列比較和分析的基礎(chǔ)。

關(guān)于兩者區(qū)別和聯(lián)系請(qǐng)參照我之前的博文。
簡單來說,
相似性指序列比對(duì)過程中用來描述檢測(cè)序列和目標(biāo)序列之間相同DNA堿基或氨基酸殘基順序占的比例高低。
同源性是序列同源或不同源的一種論斷,是個(gè)定性的概念,沒有度的差異,而相似性是量化的。
也就是說兩條序列要么同源要么不同源,不可能具有多或少的數(shù)量關(guān)系。

同源序列分為直系同源和旁系同源。直系同源體通常有相同或相似的功能,但旁系同源提不一定,進(jìn)化上講,由于缺乏原始的自然選擇的力量,繁殖出的基因副本可以自由的變異并獲得新的功能。

比對(duì)的序列數(shù)量可以分為雙序列比對(duì)和多序列比對(duì)

比對(duì)范圍來說可以分為全局比對(duì)(global alignment)和局部比對(duì)(local alignment)

全局比對(duì)考慮序列的全局相似性,局部比對(duì)考慮序列片段之間的相似性

進(jìn)行相似性比對(duì),有以下算法

1 空位罰分

2 替換記分矩陣

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容