【張勇】ChIP-seq 講習(xí)班

參考:

本講 PPT 下載鏈接為:http://pan.baidu.com/s/1skJAaAx,密碼:ga2l
視頻鏈接:https://mp.weixin.qq.com/s/JLPQbgQKUpa4ONNhzURQxw

image.png

第一部分:ChIP-seq 簡介

image.png
  • 首先了解兩個(gè)概念:

Cistrome: the set of cis-acting targets of a transacting factor on a genome scale.

Epigenome: a parallel to the word "genome"; the overall epigenetic state of a cell

  • 一般的雙端測序,R1/R2 比對到兩條鏈上面。通過Flag 可以提取比對到正反鏈的read,使用基因組瀏覽器可視化得到兩個(gè)峰圖。

    (Tips:而ChIA-PET 也是雙端測序,但是R1/R2 可能同一條鏈)

    參考: 雙端測序中read1和read2的關(guān)系

    image.png

    image.png
image.png
image.png
  • 張勇老師開發(fā)出第一個(gè)peak callling 工具(macs,現(xiàn)在更新到macs3,由師弟劉濤維護(hù)?。?/li>
image.png
  • ChIP-exo : 從5 -end 進(jìn)行酶切,提高TFBS分辨率,幾乎直接看peak,而不需要軟件找。
image.png
  • iChIP : 對不同細(xì)胞進(jìn)行index,再進(jìn)行抗體富集,運(yùn)用到單細(xì)胞領(lǐng)域.

    image.png
  • 不同的TF 結(jié)合模型:

    一般TF是sharp peak.

    image.png

第二部分:ChIP-seq 實(shí)驗(yàn)設(shè)計(jì)

image.png
image.png
image.png
  • 關(guān)于實(shí)驗(yàn)重復(fù)及其測序深度:

    • 以人類為例,一般對于轉(zhuǎn)錄因子達(dá)到20M,寬峰達(dá)到40M read 比較好。當(dāng)然read越多越好,但是read 不太多,足以檢測結(jié)合比較強(qiáng)的位點(diǎn)。
    • 重復(fù)的問題,由于剛開始的一些文章ChIP-seq沒有重復(fù),帶了一個(gè)不好的頭,后面慢慢要求2-3個(gè)重復(fù)(2-3個(gè)質(zhì)量好的重復(fù),不是做了3個(gè)重復(fù)就好)。
    image.png
  • 對照組:一般來說Input 和IgG 有一個(gè)就行,對于一些特別容易富集的區(qū)域,也就是假陽性,可以通過對照組來過濾掉。

image.png

第三部分:檢測ChIP質(zhì)量

image.png
  • 通過IGV瀏覽器查看peak 是否明顯

    image.png
  • 通過計(jì)算Frip 值:不同的TF,F(xiàn)rip 大小不同,結(jié)合越強(qiáng)的位點(diǎn),F(xiàn)rip 可能越高

    image.png
  • 交聯(lián)系數(shù):通過移動 計(jì)算正反鏈read 皮爾遜相關(guān)系數(shù)變化過程。

    • 高質(zhì)量的ChIP 正負(fù)鏈的peak ,移動到最大 重疊位置,相關(guān)系數(shù)最大,也就是圖中ChIP peak 位置。
    image.png
  • 同時(shí)比較兩個(gè)peak高度值,計(jì)算差異倍數(shù),得到NSC/RSC 結(jié)果.下圖左邊為質(zhì)量高的實(shí)驗(yàn)結(jié)果.

image.png
  • 同時(shí)計(jì)算Frip 和NSC關(guān)系,兩者之間存在明顯的聯(lián)系.也就是說Frip 高的NSC,RSC 往往也較高。

    image.png
  • IDR 方法:此方法對于重復(fù)間質(zhì)量好的樣本,IDR可能效果好,否則滿足條件的peak 會很少。

    從B圖可知,20000左右的peak ,IDR (不可重復(fù)率)較低,也就是peak 很可信。

    image.png
    image.png
  • 也可以通過peak 區(qū)域motif 富集情況,評價(jià)質(zhì)量好壞。

    image.png
  • 通過序列保守型來看:也就是通過通過profile 圖反映出富集效果。

    image.png

第四部分:完成項(xiàng)目后,需要提交哪些數(shù)據(jù)

image.png
image.png
image.png
image.png

第五部分:分析流程

image.png
  • 第一步:數(shù)據(jù)比對
image.png
  • 下一步:peak calling
image.png
  • 要發(fā)布的部分peak calling 工具

    image.png
  • 下一步:差異peak 分析

    • 定性問題:通過設(shè)置閾值,對兩組sample進(jìn)行peak 差異位點(diǎn)分析。得到有無peak的差異結(jié)果,但是對于一些在閾值邊界的位置,可能得到的差異peak 位點(diǎn),存在假陽性問題。
    • 定量問題:通過差異倍數(shù),及其顯著性來判斷差異peak. 對于組蛋白修飾來說,修飾水平的高度和表達(dá)強(qiáng)弱有關(guān)系;但是對于轉(zhuǎn)錄因子來說,可能沒有太大影響。
    image.png
  • 差異peak 目前的工具
image.png
  • 下一步:peak注釋

    image.png
image.png
  • 下一步:motif 分析

    image.png
  • 目前的工具

    image.png
  • 下一步:靶基因預(yù)測

    image.png
  • 也可以嘗試對TF進(jìn)行敲除,過表達(dá)研究目標(biāo)基因.

    image.png
  • 下一步:目標(biāo)基因GO注釋

    image.png

思考

  • 感覺做差異分析時(shí)候,定量分析采取Deseq2 或者DiffBind 結(jié)果差別較大時(shí)候,不好判斷選擇哪一個(gè)工具result.
  • 了解到ChIP-seq 靶基因?qū)ふ夜ぞ?。比如結(jié)合RNA-seq結(jié)果,判斷敲除TF,那些基因是差異基因。工具如BETA


歡迎大家評論留言,相互學(xué)習(xí)~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容