三維基因組 【一】

轉自:https://blog.csdn.net/u011262253/article/details/111691514

隨著基因組學研究的發(fā)展,由結構基因組學過渡到功能基因組學,科學家對于基因組各種元件的功能及其調控關系有了進一步的了解,為研究基因組三維結構和基因功能之間的關系提供了堅實的基礎,進而誕生了一種新的研究領域,稱之為三維基因組學,專注于研究基因組的空間結構和基因表達,調控功能的關系和影響。

image.png

一、細胞核 Nucleus

image.png

首先看下染色質的主要存儲容器——細胞核,主要看與三維基因組密切相關的三個結構:

  • 核膜 Nuclear Envelope:用來包裹染色質,控制物質進出
  • 核纖層 Nuclear Lamina:位于核膜的內表面的纖維網絡,支持核膜,錨定染色質,與核骨架相連,參與細胞周期解離和重建
  • 核仁 Nucleolus: 主要存儲合成 rRNA,存儲裝配核糖體
image.png

二、染色質疆域 Chromosome Territory,CT

在真核生物的基因組中,細胞核內的染色質分布并不是隨機的,而是不同染色體占據(jù)不同的空間。為了跨越較大的基因組距離去互相作用,比如增強子和啟動子的互作,這些密切接觸的染色質會靠的更近,這就是染色質疆域。大概就像這樣:


image.png

我們可以使用染色體構象捕獲技術(3C,4C,Hi-C,HiChIP)來獲取到3D基因組。

在二維視角下的染色質疆域


image.png

在三維視角下的染色質疆域

image.png

目前,發(fā)現(xiàn)這些區(qū)域有一定的規(guī)律:

  • 染色體的位置相對不變:這種相對不變會持續(xù)到有絲分裂開始。比如大型的,基因貧乏的染色體通常位于核層附近的外圍,而較小的,富含基因的染色體則更靠近核中心。
  • 染色質的位置會因細胞類型不同而改變:例如,X染色體已顯示在肝細胞中比在腎細胞中更頻繁地定位在外圍
  • 同源染色體在細胞間期傾向于彼此分離。

為了更方便的研究,進一步把這些互作部分劃分為:

三、染色質區(qū)室 A/B compartments

使用 Hi-C 發(fā)現(xiàn),整個基因組被分割為兩個空間區(qū)室,分布標記為 A,B 染色質區(qū),往往區(qū)室內互作頻繁,而區(qū)室間互作較少。

  • A compartments:開放的染色質,表達活躍,基因豐富,具有較高的GC含量,包含用于主動轉錄的組蛋白標記,通常位于細胞核的內部。
  • B compartments:關閉的染色質,表達不活躍,基因缺乏,結構緊湊,含有基因沉默的組蛋白標志物,位于核的外圍。它們主要由LAD組成,包含晚期復制起點。
    image.png

在生物信息分析中,我們通過計算染色體內部互作的相關性來區(qū)分兩種不同的區(qū)室。

image.png

四、拓撲結構域 Topologically associating Domains,TAD

在染色質區(qū)室中,我們還會發(fā)現(xiàn)互相作用相對頻繁的基因組區(qū)域,這些就是拓撲結構域 TAD。一般這些區(qū)域在不同的哺乳動物的不同細胞中都很保守,并且高度富集 CTCF 和 粘附蛋白。

image.png

通過計算基因互作矩陣,我們會得到一個類似上圖的大三角形,可以看到上面有幾個深紅色的三角,代表內部高度互作域被定義為拓撲結構域,一般是400-800kb較穩(wěn)定的復制單元。

TAD 的邊界:

  • 通過與上下游的互作頻率趨近于0的DI值,界定TAD邊界
  • 邊界中富含絕緣子蛋白 CTCF 結合位點、活躍轉錄標記,如H3K4me3及H3K36me3
  • 富含結構蛋白結合位點,與管家基因,轉運RNA基因和短間隔核元素(SINEs)相關的表觀遺傳標記。

目前研究最多的是,TAD通過限制每個TAD的增強子-啟動子相互作用來調節(jié)基因表達,但是TAD詳細功能還有待發(fā)現(xiàn)。

盡管許多蛋白質復合物,DNA 元件與TAD邊界相關,但TAD形成的基礎機制也很復雜,尚未完全闡明。

目前認可的模式是,以CTCF蛋白為核心,在黏附蛋白的幫助下,通過loop extrusion模型擠壓形成染色質環(huán),錨定TAD邊界,為TAD的形成提供了結構基礎。此外,TAD 邊界的剛度本身可能會導致 TAD 的形成。

TAD 可細分為 sub TAD, 大約長 100kb,sub TAD之間的邊界在不同細胞組織間具有差異,與細胞特異性的增強子-啟動子互作有關。

在細菌中,這種互作結構叫做染色質互相作用域(Chromosomal Interacting Domains,CIDs)

拓撲結構域的形成

一些蛋白質目前被認為對拓撲結構域的形成有關,其中包括轉錄因子CTCF和蛋白質復合體黏連蛋白 (cohesin)。這些蛋白通過染色質免疫共沉淀測序技術被發(fā)現(xiàn)富集在拓撲結構域的邊界上。由于邊界還富集有大量常表達基因 (housekeeping gene) 和轉運 RNA (tRNA) 基因,一種理論認為活躍的轉錄與拓撲結構域的形成有關。

五、層關聯(lián)域 Lamina Associating Domains,LAD

LAD約占基因組的40%,大小介于40kb至30Mb之間,基因較少。 LAD主要由轉錄沉默染色質組成,富含組蛋白H3K27me3 ,這是異染色質的常見翻譯后組蛋白修飾。

結構性 LAD,constitutive LAD,cLAD:富含AT的異染色質區(qū)域,靠近在核纖層上,這些區(qū)域對染色體之間的結構形成至關重要。

兼性 LAD, facultative LAD,fLAD:具有不同的核纖層相互作用,在不同細胞中包含不同的被激活或抑制基因,從而導致不同的細胞類型。

image.png

六、核仁關聯(lián)域 Nucleolar Associating Domains,NAD

NAD占基因組的4%,幾乎具有與LAD相同的所有物理特征。通過對LAD和NAD的序列分析發(fā)現(xiàn),某些區(qū)域可能在核纖層和核仁間切換。

image.png

七、染色質環(huán) Chromatin loops

染色質在空間中形成環(huán)狀結構,因此相距很遠的染色質區(qū)域也可以在三維空間中聚集在一起。 染色質環(huán)(loop)結構與調控因子緊密關聯(lián),直接對基因表達進行調控。

image.png

據(jù)推測大約50%的人類基因通過染色質環(huán)化過程參與長距離的染色質相互作用。我們可以基于基因互作矩陣,來查看互作頻率相對周圍較強的區(qū)域,在下圖中用藍色圓圈標記,這些位置就是為染色質環(huán)區(qū)域。

這種結構可以使在線性距離很遠的元件得以相遇,以此來調控生命活動,比如,從空間上拉近啟動子和增強子的距離,促使基因的轉錄起始。

分子生物學一個經典的啟動子增強子模型,普遍認為enhancer會募集很多轉錄因子以及轉錄輔助因子結合到啟動子區(qū)域形成一個環(huán)狀結構(loop)來調控基因的表達。

image.png

針對這一挑戰(zhàn),中南大學計算機學院生物信息學團隊研發(fā)了基于多組學數(shù)據(jù)集成學習的LoopPredictor方法,采用H3K27ac組蛋白以及YY1因子作為靶向基因的HiChIP數(shù)據(jù)來訓練模型,通過集成不同細胞類型的loop數(shù)據(jù)集,以及多組學(基因組、轉錄組、表觀遺傳組等)特征數(shù)據(jù),LoopPredictor能夠有效地識別具有細胞特異性的增強子介導的loop結構。與HiChIP實驗生成的H3K27ac-HiChIP數(shù)據(jù)相比,LoopPredictor能夠識別更多的具有調控功能的loop。

此外,通過將小鼠的多組學特征輸入到基于人類數(shù)據(jù)訓練的模型中,預測出的增強子介導的loop結構高度保守,進一步表明LoopPredictor具有較高的跨物種預測能力。LoopPredictor的提出對進一步解釋染色質相互作用對基因表達的影響,以及致病基因的作用機制有著重要意義。

image.png
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容