第0章、緒論
03、生物信息學(xué)的生物學(xué)基礎(chǔ)知識(shí)
一、遺傳定律
遺傳學(xué)有三大定律:分離定律、自由組合定律、鏈鎖和交換定律。前兩大定律由奧地利 科學(xué)家孟德爾利用豌豆實(shí)驗(yàn)于1865年總結(jié)發(fā)現(xiàn),第三定律由美國(guó)科學(xué)家摩爾根于1911年在研究果蠅遺傳規(guī)律時(shí)發(fā)現(xiàn)
分離定律(law of segregation):位于同源染色體上的一對(duì)等位基因在減數(shù)分裂過程中發(fā)生分離,隨機(jī)進(jìn)入不同配子中并傳遞給后代的現(xiàn)象,也稱為孟德爾分離定律
自由組合定律(law of independent assortment):位于不同染色體上的兩對(duì)或多對(duì)等位基因在減數(shù)分裂時(shí),等位基因發(fā)生分離并符合分離定律,不同的等位基因進(jìn)行自由組合進(jìn)入配子,并傳遞給后代,這種現(xiàn)象叫做孟德爾自由組合定律
連鎖遺傳交換定律(law of linkage and crossing-over):減數(shù)分裂過程中,位于同一染色體上的不同基因進(jìn)入同一配子的現(xiàn)象稱為連鎖律;位于同一染色體上的不同基因可能會(huì)發(fā)生一定頻率的交換,并導(dǎo)致其分別進(jìn)入不同的配子的現(xiàn)象稱為交換律。兩者結(jié)合在一起即為位于同一染色體上的不同基因發(fā)生連鎖或交換的遺傳定律
二、DNA的分子結(jié)構(gòu)
DNA的分子組成:組成DNA分子的基本單位是脫氧核苷酸。每個(gè)脫氧核苷酸由一分子脫氧核糖、一分子磷酸和一分子含氮堿基組成。堿基分別為腺嘌呤(adenine,A)、鳥嘌呤(guanine,G)、胞嘧啶(cytosine,C)和胸腺嘧啶(thymine,T)。因堿基的不同,可以構(gòu)成4種不同的脫氧核苷酸
DNA的分子的結(jié)構(gòu):4種脫氧核苷酸按照一定順序首尾相接構(gòu)成脫氧多核苷酸單鏈,每條脫氧核苷酸單鏈都有3’端和5’端,相鄰的脫氧核苷酸之間通過磷酸二酯鍵相連接
DNA分子的雙螺旋結(jié)構(gòu)模型要點(diǎn):
DNA由兩條堿基互補(bǔ)、反向平行排列的脫氧多核苷酸單鏈組成。A與T之間由2個(gè)氫鍵相連,C與G之間由3個(gè)氫鍵相連
DNA分子的兩條互補(bǔ)鏈圍繞一“主軸”向右盤旋形成雙螺旋結(jié)構(gòu)
雙螺旋的表面形成兩條凹槽,分為大溝和小溝
堿基排列順序的組合方式是無限的,可以形成多種不同的DNA分子
三、基因結(jié)構(gòu)
原核生物基因結(jié)構(gòu):一個(gè)完整的原核基因結(jié)構(gòu)是從5’端的啟動(dòng)區(qū)開始至3’端的終止區(qū)結(jié)束,依次包括啟動(dòng)區(qū)、5’UTR、編碼區(qū)、3’UTR、終止區(qū)
啟動(dòng)區(qū):是轉(zhuǎn)錄因子識(shí)別結(jié)合并啟動(dòng)基因轉(zhuǎn)錄的區(qū)域,包含-10、-30區(qū)等特殊結(jié)構(gòu)域區(qū)域
5’UTR:5’端非翻譯區(qū),這部分序列會(huì)轉(zhuǎn)錄為RNA,但是不會(huì)被翻譯成蛋白質(zhì)
編碼區(qū):翻譯為蛋白質(zhì),從起始密碼子開始至終止密碼子結(jié)束的區(qū)域。原核生物的編碼區(qū)不包含內(nèi)含子
3’UTR:3’端非翻譯區(qū),這部分序列會(huì)轉(zhuǎn)錄為RNA,但是不會(huì)被翻譯成蛋白質(zhì)
終止區(qū):阻礙RNA聚合酶的移動(dòng),并使其從DNA模板鏈上掉下來
真核生物基因結(jié)構(gòu):完整的真核生物基因包括增強(qiáng)子、啟動(dòng)區(qū)、5’UTR、外顯子、內(nèi)含 子、3’UTR、終止區(qū)
增強(qiáng)子:增強(qiáng)基因轉(zhuǎn)錄頻率的DNA序列,其位置可在5’端、3’端或內(nèi)含子中??煞譃榻M織細(xì)胞特異性增強(qiáng)子及誘導(dǎo)性增強(qiáng)子,組織細(xì)胞特異性增強(qiáng)子只在特定細(xì)胞的特定蛋白參與下才能發(fā)揮作用;誘導(dǎo)性增強(qiáng)子需經(jīng)過特定條件的誘導(dǎo)才增強(qiáng)基因的表達(dá)
啟動(dòng)區(qū):是轉(zhuǎn)錄因子識(shí)別結(jié)合并啟動(dòng)基因轉(zhuǎn)錄的區(qū)域,真核生物的啟動(dòng)子在-25~-30bp處有一段特定序列,也稱為TATA框,在-70到-78bp處還有一段共同序列,稱為CAAT框;在-110bp處還有一個(gè)GC框
5’UTR:5’端非翻譯區(qū)
外顯子:編碼蛋白區(qū)域
內(nèi)含子:基因內(nèi)部非編碼蛋白區(qū)域,與外顯子間隔存在
3’UTR:3’端非翻譯區(qū),該區(qū)域可能參與調(diào)控基因的表達(dá),如動(dòng)物的miRNA通過結(jié)合3’UTR區(qū)來調(diào)控基因的表達(dá)
終止區(qū):阻礙RNA聚合酶的移動(dòng),并使其與DNA模板鏈解離
四、中心法則
傳統(tǒng)的中心法則是指遺傳信息從DNA到蛋白質(zhì)的傳遞過程。DNA可自我復(fù)制,DNA轉(zhuǎn)錄為RNA;RNA可逆轉(zhuǎn)錄為DNA,RNA可自我復(fù)制,也可翻譯為蛋白質(zhì);蛋白質(zhì)參與調(diào)控DNA的復(fù)制、RNA的轉(zhuǎn)錄及蛋白質(zhì)翻譯。中心法則的擴(kuò)充內(nèi)容包括DNA的甲基化修飾、小RNA分子的調(diào)控、蛋白質(zhì)指導(dǎo)蛋白質(zhì)的折疊等
五、密碼子表
遺傳信息的儲(chǔ)存單位:信使RNA分子中,每3個(gè)相鄰的堿基序列構(gòu)成一個(gè)三聯(lián)體(triplet),每個(gè)三聯(lián)體密碼能編碼某種氨基酸,所以三聯(lián)體是遺傳信息的具體表現(xiàn)形式,又稱為三聯(lián)體密碼(triplet code)、遺傳密碼(genetic code)或密碼子(codon)
遺傳密碼的特性:通用性、簡(jiǎn)并性、起始密碼子和終止密碼子
不同的物種或者亞細(xì)胞器,密碼子及其編碼的氨基酸稍有差異,目前NCBI網(wǎng)站總結(jié)了 25種密碼子表,各個(gè)物種用得最多的還是標(biāo)準(zhǔn)密碼子表
六、蛋白質(zhì)的結(jié)構(gòu)與功能
蛋白質(zhì)有四級(jí)結(jié)構(gòu)。一級(jí)結(jié)構(gòu)是其氨基酸序列及組成;二級(jí)結(jié)構(gòu)是指蛋白質(zhì)序列折疊形成的結(jié)構(gòu),包括α螺旋、β折疊等;三級(jí)結(jié)構(gòu)是指蛋白質(zhì)在二級(jí)結(jié)構(gòu)的基礎(chǔ)上進(jìn)一步折疊形成的三維立體結(jié)構(gòu);四級(jí)結(jié)構(gòu)是指有多亞基的蛋白質(zhì)折疊形成的最終結(jié)構(gòu)
蛋白質(zhì)的一級(jí)結(jié)構(gòu)可通過密碼子表預(yù)測(cè)出來,其二、三、四級(jí)結(jié)構(gòu)需要通過軟件進(jìn)一步預(yù)測(cè)
七、PCR技術(shù)
PCR技術(shù):即聚合酶鏈?zhǔn)椒磻?yīng),是分子生物學(xué)領(lǐng)域使用最廣泛的技術(shù)之一,在引物、模板、DNA聚合酶等的存在條件下,通過循環(huán)進(jìn)行變性、退火、延伸等步驟,進(jìn)而實(shí)現(xiàn)DNA的迅速擴(kuò)增
PCR技術(shù)可以用來進(jìn)行基因擴(kuò)增、基因組的gap修補(bǔ)、基因定量等