FAIRE-seq

1.FAIRE簡介

甲醛輔助分離調(diào)控元件 (Formaldchyde?Assisted?IsoJation?of?Regulatory?Elements, FAIRE) 是近年來才建立的新技術(shù),最初應(yīng)用于酵母細(xì)胞,后被用于多種細(xì)胞,可以和DNase-Seq技術(shù)相結(jié)合,揭示開放型染色質(zhì)的特征,是研究DNA?水平調(diào)控的優(yōu)選方法.分子生物學(xué)研究表明,在個體發(fā)育過程中,用來合成RNA的DNA模板會發(fā)生規(guī)律性變化,從而調(diào)控基因表達(dá)和生物體的發(fā)育DNA?水平的基因表達(dá)調(diào)控最重要的途徑就是通過“開放”型活性染色質(zhì)(activechromation)結(jié)構(gòu).真核生物的活躍轉(zhuǎn)錄是在常染色質(zhì)上進(jìn)行的.轉(zhuǎn)錄發(fā)生之前,染色質(zhì)常常會在特定區(qū)域被解螺旋,變?yōu)樗沙跔顟B(tài),形成自由DNA。生物體通過核小體結(jié)構(gòu)的解體或改變,DNA本身局部結(jié)構(gòu)的變化,從右旋型變?yōu)樽笮?Z-DNA)等,使得結(jié)構(gòu)基因暴露,促進(jìn)轉(zhuǎn)錄因子與啟動子DNA的結(jié)合,從而誘發(fā)基因轉(zhuǎn)錄。?

研究表明,使用?DNase?I處理各種組織細(xì)胞的染色質(zhì)時,發(fā)現(xiàn)處于活躍狀態(tài)的基因比非活躍狀態(tài)的?DNA?更容易被DNase?I所降解。雞成紅細(xì)胞染色質(zhì)中,B-血紅蛋白基因比卵清蛋白基因更容易被DNase?I切割降解。與此相反,雞輸卵管細(xì)胞的染色質(zhì)中被DNaseI優(yōu)先降解的是卵清蛋白基因,而不是B-血紅蛋白基因,研究發(fā)現(xiàn),活躍表達(dá)基因所在染色質(zhì)上一般含有一個或者數(shù)個DNase?I超敏感位點,它們大多位于基因5’端啟動子區(qū)域,少數(shù)在其他位置。有人用專一切割單鏈DNA的SI核酸酶處理該基因活躍表達(dá)的染色質(zhì)DNA,證實有DNA被水解,說明該基因活躍表達(dá)時啟動區(qū)部分庁列可能解開成單鏈,從而不能繼續(xù)纏繞在核小體上,使啟動區(qū)DNA?裸露于組蛋白表面,形成了對DNase?I的超敏感現(xiàn)象。上述事實充分說明,超敏感位點的存在可能是染色質(zhì)結(jié)構(gòu)規(guī)律性變化的結(jié)果。正是由于這種變化,使DNA容易與RNA聚合酶和其他轉(zhuǎn)錄調(diào)控因子相結(jié)合,從而啟動基囚表達(dá),同時也更易于被核酸酶所降解。

2.FAIRE的發(fā)現(xiàn)過程

FAIRE的發(fā)現(xiàn)十分偶然,是在用ChIP-chip技術(shù)構(gòu)建酵母Set1甲基化轉(zhuǎn)移酶復(fù)合物的組蛋白甲基化分右圖譜的實驗中發(fā)現(xiàn)的。ChIP 實驗中需要對照DNA(INPUT DNA),制備INPUT DNA時,無需對細(xì)胞進(jìn)行甲醛處理和染色質(zhì)的免疫沉淀,只需將細(xì)胞全基因組DNA用酚氯仿抽提制備即可,而在制備INPUT DNA的實驗中,研究人員因誤操作,將制備INPUT DNA的細(xì)胞進(jìn)行了甲醛交聯(lián),但在制備DNA時未進(jìn)行反交聯(lián),而直接用酚氯仿抽提法制備基因組DNA,結(jié)果發(fā)現(xiàn)所制備的基因組DNA中,相對于非編碼區(qū) DNA(non-coding region DNA)而言,編碼區(qū)DNA(coding region DNA)得到明顯富集。 這種結(jié)果最初被解釋為該酵母細(xì)胞編碼區(qū) DNA含有大量的甲基化核小體,后來在缺少H3K4甲基化的突變體酵母紐胞系中也觀察到這種現(xiàn)象。對這一現(xiàn)象的進(jìn)一步研究,使得Nagy和Lieb在2003年首次報道了該實驗方法,該課題組主要關(guān)注染色質(zhì)組裝,尤其側(cè)重于研究核小體的動態(tài)變化。2007年,他們將這種實驗方法正式命名為 FAIRE。

3.FAIRE的原理

FAIRE實驗過程包括:細(xì)胞或組織培養(yǎng)、甲醛交聯(lián)、細(xì)胞裂解、超聲波打斷染色質(zhì),然后進(jìn)行酚氯仿抽提制備水相DNA、檢測水相DNA.在FAIRE酚氯仿抽提過程中,蛋白未交聯(lián)的DNA溶于水相,而蛋白結(jié)合型DNA留在兩相界面,從而把全基因組DNA分為兩部分(即水相和有機相DNA),然后對水相DNA?進(jìn)行檢測,常用的檢測方法有熒光定量PCR、DNA微陣列芯片、第二代測序技術(shù)等,FAIRE樣品制備及檢測過程如下圖所示:

Fig. 1.?FAIRE procedure. (A) The FAIRE procedure described in the text is shown on the left, while preparation of the reference or input sample is shown on the right. The DNA recovered from the aqueous phase of each extraction can then be used to identify sites of open chromatin using?qPCR, tiling?microarrays, or?high-throughput sequencing?applications. (B) For qPCR, a series of primers, depicted as convergent arrows, are designed to span a genomic region of interest. Sites of open chromatin are highlighted in blue, with qPCR results depicted above.?Amplicons?that span or are near the boundaries of open chromatin often result in lower relative enrichment due to shearing of DNA fragments, as shown by asterisks. (C) Microarrays. Typically we use high-resolution microarrays that tile either regions of interest or the entire genome of an organism with 50–70?bp?oligonucleotides. (D) High-throughput sequencing technologies can be used to map the DNA fragments back to the reference genome.(Ref:Giresi P G, Lieb J D. Isolation of active regulatory elements from eukaryotic chromatin using FAIRE (Formaldehyde Assisted Isolation of Regulatory Elements)[J]. Methods, 2009, 48(3):233-239.)

近年來,FAIRE?與高通量技術(shù)結(jié)合產(chǎn)生的?FAIRE-Seq?技術(shù),得到了廣泛應(yīng)用.將ChIP-Seq,DNase-Seq和FAIRE-Seq三種實驗技術(shù)聯(lián)用,可用于揭示轉(zhuǎn)錄因子結(jié)合位點、核小體分布位置、染色質(zhì)開放區(qū)域,以及三者之間的關(guān)系。三種實驗技術(shù)的原理如下圖所示:

Fig. 2.?Comparison of experimental protocols. Experiments to detect different aspects of DNA-binding proteins share many of the same steps; simplified schematics of the main steps are shown. a | Chromatin immunoprecipitation followed by sequencing (ChIP–seq) for DNA-binding proteins such as transcription factors. Recent variations on the standard protocol include using endonuclease digestion instead of sonication (ChIP–exo) to increase the resolution of binding-site detection and to eliminate contaminating DNA, and DNA amplification after ChIP for samples with limited cells. b | ChIP–seq for histone modifications uses micrococcal nuclease (MNase) digestion to fragment DNA and can also now be run on low-quantity samples when combined with the additional post-ChIP amplification. c | DNase–seq relies on digestion by the DNaseI nuclease to identify regions of nucleosome-depleted open chromatin where there are binding sites for all types of factors, but it cannot identify what specific factors are bound. d | Formaldehyde-assisted identification of regulatory elements (FAIRE–seq) similarly identifies nucleosome-depleted regions by extracting fragmented DNA that is not crosslinked to nucleosomes. LinDA, single-tube linear DNA amplification; T7, T7 phage RNA polymerase.(Ref:Furey, Terrence S . ChIP–seq and beyond: new and improved methodologies to detect and characterize protein–DNA interactions[J]. Nature Reviews Genetics, 2012, 13(12):840-852.)


4.FAIRE的下游檢測技術(shù)

FAIRE的下游檢測技術(shù),包括熒光定量PCR,DNA芯片、第二代測序技術(shù),下面簡單介紹三種檢測方法的原理及步驟.?

首先,應(yīng)明確覆瓦陣列(Tiling array)的含義.Tiling(tile path)指的是如瓦片一樣覆蓋基因組的探針序列,也可指熒光定量PCR 引物.相對于傳統(tǒng)微陣列技術(shù),TilingArray 的設(shè)計思路可以說是無偏向性的。針對所選取的染色質(zhì)區(qū)域,無任何偏倚地按著一定的間隔規(guī)律、或以序列交疊的方法、或以序列頭尾相接的方式制作成探針.將相鄰探針中心位置之間的距離定義為探針的步長(step或resolution). 熒光定量 PCR 可用于檢測開放染色質(zhì)位點,也可以用于驗證高通量測序結(jié)果的有效性.當(dāng)設(shè)計該實驗時,需要注意以下方面:須恰當(dāng)?shù)剡x擇參考對照區(qū)域,精確的引物定位,合適的定量方法]。選擇恰當(dāng)?shù)膮⒖紖^(qū)域特別重要,因為在這里我們計算的是相對于其他基因位點的富集程度。對于大多數(shù)生物的染色質(zhì)來說,我們并不確定應(yīng)該選擇哪些位點作為參考位點,即無法確定“參考的金標(biāo)準(zhǔn)”。即使某些細(xì)胞已經(jīng)有了閉合染色質(zhì)圖譜的實驗數(shù)據(jù),但是或許這些實驗數(shù)據(jù)只適用于特定生長環(huán)境條件的細(xì)胞.研究人員通常會設(shè)計相互重疊或者緊密排列的引物序列擴增待檢測的基因區(qū)域,另外還需設(shè)計一系列陽性和陰性引物。引物設(shè)計是獲得精確的熒光定量 PCR 結(jié)果的關(guān)鍵, 引物擴增產(chǎn)物大小一般為60~100 bp3,4使用相對Ct值法47來計算每個擴增片段的相對富集倍數(shù)[7,43],這里的比值即是FAIRE 樣品信號與未交聯(lián)樣品信號的比值,然后全部的比值再用最小值進(jìn)行歸一化. 對于芯片實驗來說,實驗設(shè)計是決定其成功與否的關(guān)鍵,也是獲得可靠數(shù)據(jù)的前提。芯片實驗設(shè)計主要應(yīng)該考慮以下方面:探針類型、分辨率,覆蓋的基因組范圍、芯片平臺選擇等(4,對于 FAIRE 來說,最重要是高分辨率,所謂的分辨率是指一個探針到下一個探針間的基因距離,足夠密集分布的探針才能捕獲FAIRE 收集的DNA片段(200 bp左右)包含的基因組信息,那么探針之間的最小間隔是多少呢?Simon和Lieb等人的文章1451中提到最小值應(yīng)該選65 bp 或者每個FAIRE DNA片段有三個探針分布.Giresi和Lieb43提到:寡核苷酸探針長度為50~75 bp的Tiling array,探針之間的間隔盡可能地不超過100 bp(這就使得每個FAIRE 位點的探針數(shù)目減少至1~2個.當(dāng)然也可以根據(jù)具體的需要恰當(dāng)?shù)剡x擇芯片所覆蓋的基因組范圍,如Eeckhoute 文章(中選取了染色質(zhì)8.11和12來設(shè)計探針. DNA芯片的設(shè)計和數(shù)據(jù)分析主要包括以下四個步驟: (1)芯片制備,采用光導(dǎo)原位合成或者微量點樣等方法50,5),將合成的寡核苷酸有序地固定在載體表面,形成儲存有大量信息的高密度DNA 微陣列. (2)使用LM-PCR(連接介導(dǎo)PCR)擴增FAIRE和 INPUT DNAL3.32, (3)用T4DNA聚合酶處理DNA片段,使DNA片段的末端成為平末端,之后用T4 DNA連接酶給DNA片段的末端連上不對稱的接頭,提供對DNA 片段進(jìn)行PCR擴增的引物結(jié)合位點149);最后,用與接頭DNA 互補的引物進(jìn)行PCR擴增. (4)樣品標(biāo)記、雜交反應(yīng)和信號檢測,及數(shù)據(jù)分析. 大多數(shù)尋找峰(peak)的現(xiàn)存算法,都可來識別 FAIRE 富集區(qū)域,由于FAIRE和ChIP-chip實驗數(shù)據(jù)獲取過程的相似性,這些算法同樣適用于ChIP-chip 數(shù)據(jù).Simon等人[45在文章中這里推薦ChIPOTle43或Mixer44。Eeckhoute 等人4使用了MAT算法來處理數(shù)據(jù).Giresi等人的文章中詳細(xì)說明了ChIPOTle處理FAIRE 數(shù)據(jù)的過程5,首先計算四次FAIRE 實驗數(shù)據(jù)的平均值,然后輸入到ChIPOTle3,中.對于多重實驗,要經(jīng)過Benjamini-Hochberg校正,選取P值小于10的部分 peak.另外,LeelS和 Oberleyl56)等人在文章中提到多種處理陣列設(shè)計的特殊問題及可靠的檢測方法。

5.FAIRE seq的具體步驟

(1)按生產(chǎn)商說明,制備測序文庫。這里我們推薦100~200?ng的?FAIRE?DNA樣品.首先使用?Agencourt?AMPure?XP?beads?試劑盒進(jìn)行兩輪純化與回收,然后進(jìn)行18個循環(huán)的PCR擴增,篩選200-~500bp的DNA建立最終文庫。另外,也可以用TruSeq?kit(Illumina)試劑盒來制備測序文庫。關(guān)鍵步驟:保證至少3×10’讀段(reads),才可以確保測序深度和廣度

(2)運用諸如TagDust(的算法,通過適配器過濾去除測序序列,清洗文庫.我們設(shè)定錯誤發(fā)現(xiàn)率為0.001,關(guān)鍵步驟:在清洗文庫步驟中,估計會過濾掉大概0.1~0.2%的讀段.如果過濾部分高達(dá)10%,則說明文庫的質(zhì)量不達(dá)標(biāo).

(3)使用FASTX-Toolkit?算法(http://hannonlab.cshl.edu/fastx_toolkit/) 來評估文庫質(zhì)量,比如說置信值(confidence?score)),核苷酸分布(nucleotide?distribution).關(guān)鍵步驟:相對均一的堿基分布非常重要,在每個讀段中都保證有四種核苷酸。核苷酸的誤用,特殊序列的重復(fù)出現(xiàn)和序列質(zhì)量的不穩(wěn)定性,都有可能導(dǎo)致測序文庫更為復(fù)雜以及測序錯誤增加。

(4)使用諸如Bowtie這樣的算法,將高質(zhì)量的讀段映射(mapping)到參考基因組上。大都采取默認(rèn)參數(shù),可允許的比對數(shù)量的最大值限定為4.當(dāng)有多種比對(alignment)結(jié)果存在時,Bowtie算法必定會選擇得分最高的比對結(jié)果。對于大部分的基因組和實驗來說,大約有75~85%的測序讀設(shè)可以被成功比對.

(5)數(shù)據(jù)可視化以及尋找發(fā)觀相對于背景有明顯富集的檢測區(qū)域(使用ZINB算法).

(6)使用IDR算法來評估交聯(lián)-折疊相關(guān)系數(shù).

6、FAIRE-seq分析軟件


F-Seq? :

使用高通量測序技術(shù)的標(biāo)簽測序現(xiàn)在經(jīng)常被用于識別特定的序列特征,如轉(zhuǎn)錄因子結(jié)合位點(ChIP-seq)或染色質(zhì)開放區(qū)域(DNase-seq)。為了直觀地總結(jié)和顯示單個序列數(shù)據(jù)作為一個準(zhǔn)確的和可解釋的信號,我們開發(fā)了F-Seq軟件包,它可以生成一個連續(xù)的標(biāo)簽序列密度估計,允許識別具有生物學(xué)意義的站點,其輸出可以直接顯示在UCSC Genome Browser中。

軟件介紹和下載:https://fureylab.web.unc.edu/software/fseq/

目前版本:Version 1.84







----------------------------------------------------------------------------------------------------------------------------------I am a line!-----------------------------------------------------------------------------------------


參考:

Song L , Zhang Z , Grasfeder L L , et al. Open chromatin defined by DNaseI and FAIRE identifies regulatory elements that shape cell-type identity[J]. Genome Research, 2011, 21(10):1757-1767.

Waki H, Nakamura M, Yamauchi T, et al. Global mapping of cell type-specific open chromatin by FAIRE-seq reveals the regulatory role of the NFI family in adipocyte differentiation[J]. Plos Genetics, 2011, 7(10):e1002311.

Furey, Terrence S . ChIP–seq and beyond: new and improved methodologies to detect and characterize protein–DNA interactions[J]. Nature Reviews Genetics, 2012, 13(12):840-852.

Giresi P G, Lieb J D. Isolation of active regulatory elements from eukaryotic chromatin using FAIRE (Formaldehyde Assisted Isolation of Regulatory Elements)[J]. Methods, 2009, 48(3):233-239.

Boyle, A.P., Guinney, J., Crawford, G.E. & Furey, T.S. F-Seq: a feature density estimator for high-throughput sequence tags. Bioinformatics 24,2537–2538 (2008).

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容