一、題名
基于高維特征選擇的定量序效關系研究(韓娜2013)
二、文章結構
摘要
Abstract
目錄
第一章 緒論
第二章 序列參數(shù)提取與建模方法
第三章 HLA-A~*0201限制性CTL表位的QSAM研究
第四章 MHCⅡ類分子結合肽預測
第五章 大腸桿菌啟動子的QSAM研究
第六章 總結與展望
參考文獻
致謝
作者簡介
三、關鍵詞及摘要解讀
關鍵詞:定量序效模型;地統(tǒng)計學關聯(lián);二元矩陣重排過濾器;CTL表位;MHC分子;E.coli啟動子
摘要
1、定量序效關系主要從生物分子一級序列出發(fā)定量研究序列與活性(性質)之間的內在聯(lián)系,并給出恰當?shù)暮瘮?shù)描述,從而達到對未知目標功能預測及指導結構修飾和改造等目的。特征表征和特征篩選是定量序效研究中的兩個重要問題。
2、合理的特征表征是決定定量序效研究的重要前提。一級結構決定了序列的高級結構與功能,且高級結構甚難測定而一級結構簡便易得,本文提出了僅基于序列的直接表征法和地統(tǒng)計學關聯(lián)與多尺度組分結合(Geostatistics Correlation-multi-scale Component,GC-MSC)表征法兩種特征參數(shù)方提取法。
3、特征篩選是定量序效關系研究中的另一個關鍵。無關和冗余特征將影響預測精度并對模型解釋帶來困惑。從m個特征中選取最優(yōu)特征子集理論上有2m種可能,在m較大時無法窮舉。本文提出一種基于支持向量機并引入有條件隨機矩陣的二元矩陣重排過濾器和多輪末尾淘汰相結合的高維特征篩選方法,能夠有效地篩選出意義明確的特征,且具計算簡單、篩選速度快等優(yōu)點。
4、論文從序列表征和特征選擇兩個方面出發(fā),以支持向量機(Support Vector Machine,SVM)作為基本工具,對152個HLA-A0201限制性CTL表位、IEDB數(shù)據(jù)庫中4個HLA II分子結合肽綜合數(shù)據(jù)集、38個E.coli啟動子啟動強度*進行了定量序效關系研究。
Time:09:06~09:34 28m