參考:
本講 PPT 下載鏈接為:http://pan.baidu.com/s/1skJAaAx,密碼:ga2l
視頻鏈接:https://mp.weixin.qq.com/s/JLPQbgQKUpa4ONNhzURQxw

第一部分:ChIP-seq 簡介

- 首先了解兩個(gè)概念:
Cistrome: the set of cis-acting targets of a transacting factor on a genome scale.
Epigenome: a parallel to the word "genome"; the overall epigenetic state of a cell
-
一般的雙端測序,R1/R2 比對到兩條鏈上面。通過Flag 可以提取比對到正反鏈的read,使用基因組瀏覽器可視化得到兩個(gè)峰圖。
(Tips:而ChIA-PET 也是雙端測序,但是R1/R2 可能同一條鏈)
image.pngimage.png


- 張勇老師開發(fā)出第一個(gè)peak callling 工具(macs,現(xiàn)在更新到macs3,由師弟劉濤維護(hù)?。?/li>

- ChIP-exo : 從5 -end 進(jìn)行酶切,提高TFBS分辨率,幾乎直接看peak,而不需要軟件找。

-
iChIP : 對不同細(xì)胞進(jìn)行index,再進(jìn)行抗體富集,運(yùn)用到單細(xì)胞領(lǐng)域.
image.png
-
不同的TF 結(jié)合模型:
一般TF是sharp peak.
image.png
第二部分:ChIP-seq 實(shí)驗(yàn)設(shè)計(jì)



-
關(guān)于實(shí)驗(yàn)重復(fù)及其測序深度:
- 以人類為例,一般對于轉(zhuǎn)錄因子達(dá)到20M,寬峰達(dá)到40M read 比較好。當(dāng)然read越多越好,但是read 不太多,足以檢測結(jié)合比較強(qiáng)的位點(diǎn)。
- 重復(fù)的問題,由于剛開始的一些文章ChIP-seq沒有重復(fù),帶了一個(gè)不好的頭,后面慢慢要求2-3個(gè)重復(fù)(2-3個(gè)質(zhì)量好的重復(fù),不是做了3個(gè)重復(fù)就好)。
image.png 對照組:一般來說Input 和IgG 有一個(gè)就行,對于一些特別容易富集的區(qū)域,也就是假陽性,可以通過對照組來過濾掉。

第三部分:檢測ChIP質(zhì)量

-
通過IGV瀏覽器查看peak 是否明顯
image.png -
通過計(jì)算Frip 值:不同的TF,F(xiàn)rip 大小不同,結(jié)合越強(qiáng)的位點(diǎn),F(xiàn)rip 可能越高
image.png -
交聯(lián)系數(shù):通過移動 計(jì)算正反鏈read 皮爾遜相關(guān)系數(shù)變化過程。
- 高質(zhì)量的ChIP 正負(fù)鏈的peak ,移動到最大 重疊位置,相關(guān)系數(shù)最大,也就是圖中ChIP peak 位置。
image.png 同時(shí)比較兩個(gè)peak高度值,計(jì)算差異倍數(shù),得到NSC/RSC 結(jié)果.下圖左邊為質(zhì)量高的實(shí)驗(yàn)結(jié)果.

-
同時(shí)計(jì)算Frip 和NSC關(guān)系,兩者之間存在明顯的聯(lián)系.也就是說Frip 高的NSC,RSC 往往也較高。
image.png -
IDR 方法:此方法對于重復(fù)間質(zhì)量好的樣本,IDR可能效果好,否則滿足條件的peak 會很少。
從B圖可知,20000左右的peak ,IDR (不可重復(fù)率)較低,也就是peak 很可信。
image.pngimage.png -
也可以通過peak 區(qū)域motif 富集情況,評價(jià)質(zhì)量好壞。
image.png -
通過序列保守型來看:也就是通過通過profile 圖反映出富集效果。
image.png
第四部分:完成項(xiàng)目后,需要提交哪些數(shù)據(jù)




第五部分:分析流程

- 第一步:數(shù)據(jù)比對

- 下一步:peak calling

-
要發(fā)布的部分peak calling 工具
image.png -
下一步:差異peak 分析
- 定性問題:通過設(shè)置閾值,對兩組sample進(jìn)行peak 差異位點(diǎn)分析。得到有無peak的差異結(jié)果,但是對于一些在閾值邊界的位置,可能得到的差異peak 位點(diǎn),存在假陽性問題。
- 定量問題:通過差異倍數(shù),及其顯著性來判斷差異peak. 對于組蛋白修飾來說,修飾水平的高度和表達(dá)強(qiáng)弱有關(guān)系;但是對于轉(zhuǎn)錄因子來說,可能沒有太大影響。
image.png
- 差異peak 目前的工具

-
下一步:peak注釋
image.png

-
下一步:motif 分析
image.png -
目前的工具
image.png -
下一步:靶基因預(yù)測
image.png -
也可以嘗試對TF進(jìn)行敲除,過表達(dá)研究目標(biāo)基因.
image.png
-
下一步:目標(biāo)基因GO注釋
image.png
思考
- 感覺做差異分析時(shí)候,定量分析采取Deseq2 或者DiffBind 結(jié)果差別較大時(shí)候,不好判斷選擇哪一個(gè)工具result.
-
了解到ChIP-seq 靶基因?qū)ふ夜ぞ?。比如結(jié)合RNA-seq結(jié)果,判斷敲除TF,那些基因是差異基因。工具如BETA
歡迎大家評論留言,相互學(xué)習(xí)~





















