一、題名
藥效多肽的定量序效關(guān)系研究(王立峰2014)
二、文章結(jié)構(gòu)
摘要
Abstract
中英文縮寫一覽表
第一章緒論
第二章原理與方法
第三章結(jié)合SVR與高維特征篩選方法的藥效家肽QSAM研完
第四章多肽一級結(jié)構(gòu)表征與抗菌肽QSAM建模
第五章藥效多肽的個體化QSAM研究
第六章總結(jié)與下一步研究計(jì)劃
參考文獻(xiàn)
致謝
作者簡介
附表
三、關(guān)鍵詞及摘要解讀
關(guān)鍵詞:藥效多肽;定量序效關(guān)系;支持向量回歸;描述子;特征篩選;個體化預(yù)測;解釋性
摘要
1、多肽類藥物具有分子量小、熱穩(wěn)定性好、特異性強(qiáng)及不易產(chǎn)生免疫原性等優(yōu)點(diǎn);但現(xiàn)有絕大多數(shù)藥效多肽的生物活性還不夠理想、不能滿足實(shí)際生產(chǎn)應(yīng)用要求。因此,對已發(fā)現(xiàn)的數(shù)量足夠多的藥效多肽進(jìn)行有目的地改造、進(jìn)一步優(yōu)化設(shè)計(jì)新的高活性藥效多肽分子具有重要的理論意義和應(yīng)用價值。
2、肽和蛋白的空間結(jié)構(gòu)與生物學(xué)功能本質(zhì)上是由其一級結(jié)構(gòu)(即氨基酸組成序列)決定的,高級空間結(jié)構(gòu)較難測定且在后續(xù)指導(dǎo)合成中難以精確實(shí)現(xiàn),而肽的一級序列結(jié)構(gòu)簡便易得。因此,基于一級序列結(jié)構(gòu)的多肽定量序效模型(Quantitative Sequence-Activity Model,QSAM)成為設(shè)計(jì)預(yù)測高活性新藥效多肽的有效手段。
3、本文以支持向量回歸(Support Vector Regression,SVR)為基礎(chǔ)建模工具,先后從序列結(jié)構(gòu)表征、特征篩選、個體化預(yù)測和模型解釋等四個關(guān)鍵環(huán)節(jié)出發(fā),對多肽序效關(guān)系模型進(jìn)行了優(yōu)化改進(jìn),獲得了能夠高效穩(wěn)定預(yù)測生物活性并明確指導(dǎo)結(jié)構(gòu)優(yōu)化與改造的多肽QSAM模型,主要工作包括:
- 序列結(jié)構(gòu)表征,即如何有效地對多肽一級序列結(jié)構(gòu)進(jìn)行數(shù)值化轉(zhuǎn)換,獲得統(tǒng)計(jì)模型可識別的描述特征。本文以天然氨基酸的531個物化性質(zhì)作為描述子(命名為AA531)對多肽序列進(jìn)行全面綜合表征,為進(jìn)一步克服AA531不適用于不等長肽體系的缺陷并綜合考慮多肽序列的上下文關(guān)聯(lián),引入地統(tǒng)計(jì)學(xué)(Geostatistics,GS)和多尺度組分(Multi-Scale ComponentMSC)構(gòu)建描述子GS-AA531和AA531-MSC。
- 特征篩選,并非所有特征都對建模有用,冗余或無用特征會對模型精度和穩(wěn)定性產(chǎn)生不利影響。對AA531系列描述子表征多肽產(chǎn)生的高維特征集,本文構(gòu)建二元矩陣重置過濾器(Binary Matrix Resetting Filter,BMRF)實(shí)現(xiàn)特征非線性快速降維,再結(jié)合多輪末尾淘汰法(Multi-Round Last-Elimination,MRLE)繼續(xù)精細(xì)篩選,最終得到少量的、有明確統(tǒng)計(jì)意義的關(guān)鍵特征。
- 個體化預(yù)測,具有相似分子結(jié)構(gòu)與理化屬性的肽類分子,其生物活性往往也較接近。本文首次提出“活性多肽個體化預(yù)測”:基于地統(tǒng)計(jì)學(xué)半變異函數(shù),為每一待測多肽樣本選擇近鄰樣本構(gòu)成其特有的訓(xùn)練樣本集,基于保留描述符和特有訓(xùn)練樣本集,對每一待測多肽樣本實(shí)施個體化預(yù)測。
- 模型解釋,高精度預(yù)測和合理解釋是回歸模型的兩大主題。針對肽SVR回歸模型本身可解釋性差的缺陷,本文引入基于F測驗(yàn)的模型顯著性分析、保留描述符重要性及效應(yīng)分析,顯著增強(qiáng)了多肽SVR回歸預(yù)測模型的可解釋性能,為后續(xù)序列結(jié)構(gòu)優(yōu)化與改造提供指導(dǎo)。