1.FAIRE簡介
甲醛輔助分離調(diào)控元件 (Formaldchyde?Assisted?IsoJation?of?Regulatory?Elements, FAIRE) 是近年來才建立的新技術(shù),最初應(yīng)用于酵母細(xì)胞,后被用于多種細(xì)胞,可以和DNase-Seq技術(shù)相結(jié)合,揭示開放型染色質(zhì)的特征,是研究DNA?水平調(diào)控的優(yōu)選方法.分子生物學(xué)研究表明,在個體發(fā)育過程中,用來合成RNA的DNA模板會發(fā)生規(guī)律性變化,從而調(diào)控基因表達(dá)和生物體的發(fā)育DNA?水平的基因表達(dá)調(diào)控最重要的途徑就是通過“開放”型活性染色質(zhì)(activechromation)結(jié)構(gòu).真核生物的活躍轉(zhuǎn)錄是在常染色質(zhì)上進(jìn)行的.轉(zhuǎn)錄發(fā)生之前,染色質(zhì)常常會在特定區(qū)域被解螺旋,變?yōu)樗沙跔顟B(tài),形成自由DNA。生物體通過核小體結(jié)構(gòu)的解體或改變,DNA本身局部結(jié)構(gòu)的變化,從右旋型變?yōu)樽笮?Z-DNA)等,使得結(jié)構(gòu)基因暴露,促進(jìn)轉(zhuǎn)錄因子與啟動子DNA的結(jié)合,從而誘發(fā)基因轉(zhuǎn)錄。?
研究表明,使用?DNase?I處理各種組織細(xì)胞的染色質(zhì)時,發(fā)現(xiàn)處于活躍狀態(tài)的基因比非活躍狀態(tài)的?DNA?更容易被DNase?I所降解。雞成紅細(xì)胞染色質(zhì)中,B-血紅蛋白基因比卵清蛋白基因更容易被DNase?I切割降解。與此相反,雞輸卵管細(xì)胞的染色質(zhì)中被DNaseI優(yōu)先降解的是卵清蛋白基因,而不是B-血紅蛋白基因,研究發(fā)現(xiàn),活躍表達(dá)基因所在染色質(zhì)上一般含有一個或者數(shù)個DNase?I超敏感位點,它們大多位于基因5’端啟動子區(qū)域,少數(shù)在其他位置。有人用專一切割單鏈DNA的SI核酸酶處理該基因活躍表達(dá)的染色質(zhì)DNA,證實有DNA被水解,說明該基因活躍表達(dá)時啟動區(qū)部分庁列可能解開成單鏈,從而不能繼續(xù)纏繞在核小體上,使啟動區(qū)DNA?裸露于組蛋白表面,形成了對DNase?I的超敏感現(xiàn)象。上述事實充分說明,超敏感位點的存在可能是染色質(zhì)結(jié)構(gòu)規(guī)律性變化的結(jié)果。正是由于這種變化,使DNA容易與RNA聚合酶和其他轉(zhuǎn)錄調(diào)控因子相結(jié)合,從而啟動基囚表達(dá),同時也更易于被核酸酶所降解。
2.FAIRE的發(fā)現(xiàn)過程
FAIRE的發(fā)現(xiàn)十分偶然,是在用ChIP-chip技術(shù)構(gòu)建酵母Set1甲基化轉(zhuǎn)移酶復(fù)合物的組蛋白甲基化分右圖譜的實驗中發(fā)現(xiàn)的。ChIP 實驗中需要對照DNA(INPUT DNA),制備INPUT DNA時,無需對細(xì)胞進(jìn)行甲醛處理和染色質(zhì)的免疫沉淀,只需將細(xì)胞全基因組DNA用酚氯仿抽提制備即可,而在制備INPUT DNA的實驗中,研究人員因誤操作,將制備INPUT DNA的細(xì)胞進(jìn)行了甲醛交聯(lián),但在制備DNA時未進(jìn)行反交聯(lián),而直接用酚氯仿抽提法制備基因組DNA,結(jié)果發(fā)現(xiàn)所制備的基因組DNA中,相對于非編碼區(qū) DNA(non-coding region DNA)而言,編碼區(qū)DNA(coding region DNA)得到明顯富集。 這種結(jié)果最初被解釋為該酵母細(xì)胞編碼區(qū) DNA含有大量的甲基化核小體,后來在缺少H3K4甲基化的突變體酵母紐胞系中也觀察到這種現(xiàn)象。對這一現(xiàn)象的進(jìn)一步研究,使得Nagy和Lieb在2003年首次報道了該實驗方法,該課題組主要關(guān)注染色質(zhì)組裝,尤其側(cè)重于研究核小體的動態(tài)變化。2007年,他們將這種實驗方法正式命名為 FAIRE。
3.FAIRE的原理
FAIRE實驗過程包括:細(xì)胞或組織培養(yǎng)、甲醛交聯(lián)、細(xì)胞裂解、超聲波打斷染色質(zhì),然后進(jìn)行酚氯仿抽提制備水相DNA、檢測水相DNA.在FAIRE酚氯仿抽提過程中,蛋白未交聯(lián)的DNA溶于水相,而蛋白結(jié)合型DNA留在兩相界面,從而把全基因組DNA分為兩部分(即水相和有機相DNA),然后對水相DNA?進(jìn)行檢測,常用的檢測方法有熒光定量PCR、DNA微陣列芯片、第二代測序技術(shù)等,FAIRE樣品制備及檢測過程如下圖所示:

近年來,FAIRE?與高通量技術(shù)結(jié)合產(chǎn)生的?FAIRE-Seq?技術(shù),得到了廣泛應(yīng)用.將ChIP-Seq,DNase-Seq和FAIRE-Seq三種實驗技術(shù)聯(lián)用,可用于揭示轉(zhuǎn)錄因子結(jié)合位點、核小體分布位置、染色質(zhì)開放區(qū)域,以及三者之間的關(guān)系。三種實驗技術(shù)的原理如下圖所示:

4.FAIRE的下游檢測技術(shù)
FAIRE的下游檢測技術(shù),包括熒光定量PCR,DNA芯片、第二代測序技術(shù),下面簡單介紹三種檢測方法的原理及步驟.?
首先,應(yīng)明確覆瓦陣列(Tiling array)的含義.Tiling(tile path)指的是如瓦片一樣覆蓋基因組的探針序列,也可指熒光定量PCR 引物.相對于傳統(tǒng)微陣列技術(shù),TilingArray 的設(shè)計思路可以說是無偏向性的。針對所選取的染色質(zhì)區(qū)域,無任何偏倚地按著一定的間隔規(guī)律、或以序列交疊的方法、或以序列頭尾相接的方式制作成探針.將相鄰探針中心位置之間的距離定義為探針的步長(step或resolution). 熒光定量 PCR 可用于檢測開放染色質(zhì)位點,也可以用于驗證高通量測序結(jié)果的有效性.當(dāng)設(shè)計該實驗時,需要注意以下方面:須恰當(dāng)?shù)剡x擇參考對照區(qū)域,精確的引物定位,合適的定量方法]。選擇恰當(dāng)?shù)膮⒖紖^(qū)域特別重要,因為在這里我們計算的是相對于其他基因位點的富集程度。對于大多數(shù)生物的染色質(zhì)來說,我們并不確定應(yīng)該選擇哪些位點作為參考位點,即無法確定“參考的金標(biāo)準(zhǔn)”。即使某些細(xì)胞已經(jīng)有了閉合染色質(zhì)圖譜的實驗數(shù)據(jù),但是或許這些實驗數(shù)據(jù)只適用于特定生長環(huán)境條件的細(xì)胞.研究人員通常會設(shè)計相互重疊或者緊密排列的引物序列擴增待檢測的基因區(qū)域,另外還需設(shè)計一系列陽性和陰性引物。引物設(shè)計是獲得精確的熒光定量 PCR 結(jié)果的關(guān)鍵, 引物擴增產(chǎn)物大小一般為60~100 bp3,4使用相對Ct值法47來計算每個擴增片段的相對富集倍數(shù)[7,43],這里的比值即是FAIRE 樣品信號與未交聯(lián)樣品信號的比值,然后全部的比值再用最小值進(jìn)行歸一化. 對于芯片實驗來說,實驗設(shè)計是決定其成功與否的關(guān)鍵,也是獲得可靠數(shù)據(jù)的前提。芯片實驗設(shè)計主要應(yīng)該考慮以下方面:探針類型、分辨率,覆蓋的基因組范圍、芯片平臺選擇等(4,對于 FAIRE 來說,最重要是高分辨率,所謂的分辨率是指一個探針到下一個探針間的基因距離,足夠密集分布的探針才能捕獲FAIRE 收集的DNA片段(200 bp左右)包含的基因組信息,那么探針之間的最小間隔是多少呢?Simon和Lieb等人的文章1451中提到最小值應(yīng)該選65 bp 或者每個FAIRE DNA片段有三個探針分布.Giresi和Lieb43提到:寡核苷酸探針長度為50~75 bp的Tiling array,探針之間的間隔盡可能地不超過100 bp(這就使得每個FAIRE 位點的探針數(shù)目減少至1~2個.當(dāng)然也可以根據(jù)具體的需要恰當(dāng)?shù)剡x擇芯片所覆蓋的基因組范圍,如Eeckhoute 文章(中選取了染色質(zhì)8.11和12來設(shè)計探針. DNA芯片的設(shè)計和數(shù)據(jù)分析主要包括以下四個步驟: (1)芯片制備,采用光導(dǎo)原位合成或者微量點樣等方法50,5),將合成的寡核苷酸有序地固定在載體表面,形成儲存有大量信息的高密度DNA 微陣列. (2)使用LM-PCR(連接介導(dǎo)PCR)擴增FAIRE和 INPUT DNAL3.32, (3)用T4DNA聚合酶處理DNA片段,使DNA片段的末端成為平末端,之后用T4 DNA連接酶給DNA片段的末端連上不對稱的接頭,提供對DNA 片段進(jìn)行PCR擴增的引物結(jié)合位點149);最后,用與接頭DNA 互補的引物進(jìn)行PCR擴增. (4)樣品標(biāo)記、雜交反應(yīng)和信號檢測,及數(shù)據(jù)分析. 大多數(shù)尋找峰(peak)的現(xiàn)存算法,都可來識別 FAIRE 富集區(qū)域,由于FAIRE和ChIP-chip實驗數(shù)據(jù)獲取過程的相似性,這些算法同樣適用于ChIP-chip 數(shù)據(jù).Simon等人[45在文章中這里推薦ChIPOTle43或Mixer44。Eeckhoute 等人4使用了MAT算法來處理數(shù)據(jù).Giresi等人的文章中詳細(xì)說明了ChIPOTle處理FAIRE 數(shù)據(jù)的過程5,首先計算四次FAIRE 實驗數(shù)據(jù)的平均值,然后輸入到ChIPOTle3,中.對于多重實驗,要經(jīng)過Benjamini-Hochberg校正,選取P值小于10的部分 peak.另外,LeelS和 Oberleyl56)等人在文章中提到多種處理陣列設(shè)計的特殊問題及可靠的檢測方法。
5.FAIRE seq的具體步驟
(1)按生產(chǎn)商說明,制備測序文庫。這里我們推薦100~200?ng的?FAIRE?DNA樣品.首先使用?Agencourt?AMPure?XP?beads?試劑盒進(jìn)行兩輪純化與回收,然后進(jìn)行18個循環(huán)的PCR擴增,篩選200-~500bp的DNA建立最終文庫。另外,也可以用TruSeq?kit(Illumina)試劑盒來制備測序文庫。關(guān)鍵步驟:保證至少3×10’讀段(reads),才可以確保測序深度和廣度
(2)運用諸如TagDust(的算法,通過適配器過濾去除測序序列,清洗文庫.我們設(shè)定錯誤發(fā)現(xiàn)率為0.001,關(guān)鍵步驟:在清洗文庫步驟中,估計會過濾掉大概0.1~0.2%的讀段.如果過濾部分高達(dá)10%,則說明文庫的質(zhì)量不達(dá)標(biāo).
(3)使用FASTX-Toolkit?算法(http://hannonlab.cshl.edu/fastx_toolkit/) 來評估文庫質(zhì)量,比如說置信值(confidence?score)),核苷酸分布(nucleotide?distribution).關(guān)鍵步驟:相對均一的堿基分布非常重要,在每個讀段中都保證有四種核苷酸。核苷酸的誤用,特殊序列的重復(fù)出現(xiàn)和序列質(zhì)量的不穩(wěn)定性,都有可能導(dǎo)致測序文庫更為復(fù)雜以及測序錯誤增加。
(4)使用諸如Bowtie這樣的算法,將高質(zhì)量的讀段映射(mapping)到參考基因組上。大都采取默認(rèn)參數(shù),可允許的比對數(shù)量的最大值限定為4.當(dāng)有多種比對(alignment)結(jié)果存在時,Bowtie算法必定會選擇得分最高的比對結(jié)果。對于大部分的基因組和實驗來說,大約有75~85%的測序讀設(shè)可以被成功比對.
(5)數(shù)據(jù)可視化以及尋找發(fā)觀相對于背景有明顯富集的檢測區(qū)域(使用ZINB算法).
(6)使用IDR算法來評估交聯(lián)-折疊相關(guān)系數(shù).
6、FAIRE-seq分析軟件
F-Seq? :
使用高通量測序技術(shù)的標(biāo)簽測序現(xiàn)在經(jīng)常被用于識別特定的序列特征,如轉(zhuǎn)錄因子結(jié)合位點(ChIP-seq)或染色質(zhì)開放區(qū)域(DNase-seq)。為了直觀地總結(jié)和顯示單個序列數(shù)據(jù)作為一個準(zhǔn)確的和可解釋的信號,我們開發(fā)了F-Seq軟件包,它可以生成一個連續(xù)的標(biāo)簽序列密度估計,允許識別具有生物學(xué)意義的站點,其輸出可以直接顯示在UCSC Genome Browser中。
軟件介紹和下載:https://fureylab.web.unc.edu/software/fseq/
目前版本:Version 1.84
----------------------------------------------------------------------------------------------------------------------------------I am a line!-----------------------------------------------------------------------------------------
參考:
Song L , Zhang Z , Grasfeder L L , et al. Open chromatin defined by DNaseI and FAIRE identifies regulatory elements that shape cell-type identity[J]. Genome Research, 2011, 21(10):1757-1767.
Waki H, Nakamura M, Yamauchi T, et al. Global mapping of cell type-specific open chromatin by FAIRE-seq reveals the regulatory role of the NFI family in adipocyte differentiation[J]. Plos Genetics, 2011, 7(10):e1002311.
Furey, Terrence S . ChIP–seq and beyond: new and improved methodologies to detect and characterize protein–DNA interactions[J]. Nature Reviews Genetics, 2012, 13(12):840-852.
Giresi P G, Lieb J D. Isolation of active regulatory elements from eukaryotic chromatin using FAIRE (Formaldehyde Assisted Isolation of Regulatory Elements)[J]. Methods, 2009, 48(3):233-239.
Boyle, A.P., Guinney, J., Crawford, G.E. & Furey, T.S. F-Seq: a feature density estimator for high-throughput sequence tags. Bioinformatics 24,2537–2538 (2008).