DNA的甲基化是在DNA的序列不變的條件下,在其中某些堿基上加上甲基的這樣一個(gè)過(guò)程。DNA甲基化的結(jié)果,一般是使甲基化位點(diǎn)的下游的基因表達(dá)量變少。
DNA甲基轉(zhuǎn)移酶家族(Dnmts)催化甲基從S-腺嘌呤甲硫氨酸(SAM)轉(zhuǎn)移至胞嘧啶殘基的第五個(gè)碳,形成5-甲基胞嘧啶(5mC)。
(a)Dnmt3a和Dnmt3b是從頭 Dnmts并將甲基(紅色)轉(zhuǎn)移到裸DNA上。
(b)Dnmt1是維持Dnmt并在復(fù)制期間維持DNA甲基化模式。當(dāng)DNA經(jīng)歷半保守復(fù)制時(shí),親本DNA支架保留原始DNA甲基化模式(灰色)。Dnmt1與復(fù)制灶相關(guān)聯(lián),并通過(guò)在新形成的子鏈(藍(lán)色)上添加甲基(紅色)來(lái)精確復(fù)制原始DNA甲基化模式。

DNA甲基化與組蛋白修飾和microRNA(miRNA)一起調(diào)節(jié)轉(zhuǎn)錄。在真核生物中,DNA與組蛋白結(jié)合,有助于將長(zhǎng)鏈DNA包裝到小核區(qū)。將包括甲基化,乙?;?,遍在蛋白化和磷酸化的化學(xué)修飾添加到N-末端組蛋白尾部的三個(gè)特定氨基酸上。這些修飾不僅影響DNA鏈的包裝方式,還影響其轉(zhuǎn)錄活性。松散DNA與組蛋白結(jié)合的組蛋白修飾通常為轉(zhuǎn)錄提供了允許的環(huán)境,而緊密包裝DNA和組蛋白的組蛋白修飾抑制了基因表達(dá)。Dnmts直接與調(diào)節(jié)通常參與基因抑制的組蛋白修飾的酶相互作用。已知Dnmt1和Dnmt3a都與組蛋白甲基轉(zhuǎn)移酶SUV39H1結(jié)合,后者通過(guò)H3K9上的甲基化來(lái)限制基因表達(dá)。此外,Dnmt1和Dnmt3b都可以結(jié)合組蛋白脫乙酰酶,去除組蛋白的乙?;?,使DNA包裝更緊密,限制轉(zhuǎn)錄的進(jìn)入。通常,Dnmts與組蛋白修飾酶配合,所述組蛋白修飾酶參與添加和/或剝離組蛋白標(biāo)記,以便在基因區(qū)域上施加抑制狀態(tài)。
用亞硫酸氫鹽來(lái)處理DNA。DNA當(dāng)中,沒(méi)有甲基化或羥甲基化的C堿基,就會(huì)被轉(zhuǎn)化成U堿基。
在弱酸性條件下,亞硫酸氫根會(huì)結(jié)合到?jīng)]有甲基化的C堿基的6位。而甲基化了的C堿基不會(huì)和亞硫酸氫根發(fā)生這個(gè)反應(yīng)的。然后用堿來(lái)處理。結(jié)合了亞硫酸氫根的非甲基化的C,就被脫氨基,并且脫亞硫酸根。然后,就被轉(zhuǎn)化成U堿基。甲基化或者羥甲基化的C堿基還保持了是“C”。
用亞硫酸氫鹽來(lái)處理DNA,可以讓99%左右的非甲基化的C堿基變成U。也就是說(shuō)這種方法的的轉(zhuǎn)化效率非常高,轉(zhuǎn)化效率達(dá)到了99%。
經(jīng)過(guò)亞硫酸氫鹽轉(zhuǎn)化過(guò)的DNA,再經(jīng)過(guò)PCR,PCR新合成出來(lái)的鏈,U堿基的位置,就會(huì)被替換成了“T”。那么在接下來(lái)的測(cè)序過(guò)程中,測(cè)到的也是T堿基。而甲基化的C,因?yàn)闆](méi)有被亞硫酸氫鹽所轉(zhuǎn)化,所以,在接下來(lái)的測(cè)序過(guò)程中,被測(cè)到的,還是“C”堿基。
甲基化的建庫(kù)過(guò)程。
第一種,Illumina公司的Truseq DNA建庫(kù)方法。
因?yàn)镮llumina Truseq DNA建庫(kù)試劑盒當(dāng)中,它所提供的接頭上的C堿基都是已經(jīng)經(jīng)過(guò)甲基化修飾了。所以,用這些接頭做出來(lái)的文庫(kù),在用亞硫酸氫鹽做轉(zhuǎn)化的過(guò)程當(dāng)中,它的(接頭上的)C還是保持是C ,不會(huì)被轉(zhuǎn)成U。帶了這些接頭的文庫(kù)分子,就可以和測(cè)序芯片上的草皮DNA發(fā)生互補(bǔ)雜交。并且進(jìn)一步發(fā)生橋式PCR反應(yīng)。生成測(cè)序用的DNA的簇(Cluster)。但是,這個(gè)方法有一個(gè)缺點(diǎn),就是在用亞硫酸氫鹽處理DNA文庫(kù)的時(shí)侯,90%以上的DNA鏈會(huì)斷掉。這樣,已經(jīng)建好的文庫(kù),其中90%分子會(huì)被破壞掉。也就是說(shuō)文庫(kù)的豐富度就會(huì)損失90%以上。它的好處就是,在這個(gè)建庫(kù)過(guò)程當(dāng)中用的PCR循環(huán)數(shù)較少。所以它PCR擴(kuò)增效率不同,所引起的文庫(kù)不均一程度也就較低。也就是我們通常所說(shuō)的PCR bias較少。
第二種,EpiCentre公司開(kāi)發(fā)的EpiGnome方法。
第1步,亞硫酸氫鹽先處理DNA,把未甲基化的C都轉(zhuǎn)變成U。
第2步,把帶標(biāo)簽1的隨機(jī)引物加入,進(jìn)行第一次的復(fù)制。得到第1條的復(fù)制鏈。
第3步,消化掉過(guò)量的引物。
第4步,加入帶末端終止堿基、并帶標(biāo)簽2的隨機(jī)引物。這個(gè)引物的作用是讓第1復(fù)制鏈延伸,并且加上標(biāo)簽2。
第5步,加入建庫(kù)的PCR引物,進(jìn)行PCR。通過(guò)PCR,把Index序列和成簇引物序列加入到鏈的兩側(cè)。得到真正的文庫(kù)。
這個(gè)方法的優(yōu)點(diǎn)是,把亞硫酸氫鹽處理的過(guò)程,放在了建庫(kù)之前。這樣建成的庫(kù)的豐富程度會(huì)比較高。但缺點(diǎn)就是要做較多的PCR循環(huán),那么有了比較多的PCR循環(huán)之后,PCR產(chǎn)物的擴(kuò)增均一性是不太好的。也就是說(shuō)PCR bias會(huì)比較大。
因?yàn)榧谆膸?kù)中經(jīng)過(guò)亞硫酸氫鹽處理,絕大多數(shù)的C都變成了T。所以,這個(gè)文庫(kù)中是嚴(yán)重地缺少C堿基的,也就是四種堿基的比例是嚴(yán)重不平衡的。這樣在用HiSeq 2000或2500測(cè)序儀來(lái)測(cè)甲基化文庫(kù)的過(guò)程當(dāng)中,文庫(kù)測(cè)序得到的數(shù)據(jù)質(zhì)理就較差。并且經(jīng)過(guò)PF過(guò)濾得到的有效的數(shù)據(jù)產(chǎn)量也會(huì)較低。為了彌補(bǔ)甲基化文庫(kù)的堿基不平衡性,一般情況下,在上機(jī)過(guò)程當(dāng)中,是摻入大比例的基因組文庫(kù),或者PhiX文庫(kù),來(lái)補(bǔ)充比較多的C堿基,一般會(huì)摻30%的PhiX文庫(kù)、或者基因組文庫(kù)。在摻入30%的PhiX文庫(kù)的條件下,一條HiSeq 2000 V3 PE100的Lane,大概可以得到20G 左右的甲基化文庫(kù)數(shù)據(jù)。也就是說(shuō),在HiSeq 2000或者2500平臺(tái)上,甲基化文庫(kù)的測(cè)序數(shù)據(jù)產(chǎn)量,一直都不是很高。質(zhì)量也比較低。
來(lái)源:thinkando