進(jìn)化上比較年輕的防御代謝物通過古老的TOR信號(hào)通路影響植物根部發(fā)育
原文題目:An evolutionarily young defense metabolite influences the root growth of plants via the ancient TOR signaling pathway
原文地址:https://elifesciences.org/articles/29353
為了能夠適應(yīng)環(huán)境,植物需要監(jiān)控自身的代謝途徑,能夠符合當(dāng)前的生長和防御。初期代謝產(chǎn)物可以通過遍在保守TOR(Target of Rapamycin)通路進(jìn)行衡量,在有限的能量和影響下平衡生長和發(fā)育之間的關(guān)系。最新的工作表明,植物能夠先估計(jì)防御性代謝產(chǎn)物,制定好某些策略從而快速將資源重定位到植物生長和發(fā)育的位置。當(dāng)然,這種機(jī)制肯定還沒有完全研究清楚,所以作者才寫了這篇文章。作者使用了glucosinolates,硫代葡萄糖苷,一類重要的植物防御性代謝產(chǎn)物做了這項(xiàng)研究。他們發(fā)現(xiàn)了一個(gè)和硫代葡萄糖苷完全不同的一個(gè)新的信號(hào)屬性(signaling properties),并且在植物和真菌中都有,叫做3-羥丙基芥子油苷(3-
hydroxypropylglucosinolate)。該防御性代謝產(chǎn)物,或者說獲得性成分(derived compounds),能夠可逆地抑制植物的根部生長和發(fā)育。3-羥丙基芥子油苷信號(hào)通過古老的TOR通路里的基因發(fā)育發(fā)揮功能。如果該事件不是特異的,那么就說明會(huì)有其他在進(jìn)化上比較新的植物代謝物和古老的信號(hào)通路相連。
基于模型的ChIP-Seq分析
原文標(biāo)題:Model-based Analysis of ChIP-Seq (MACS)
原文鏈接:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2592715/
軟件地址:https://github.com/taoliu/MACS
在每日文獻(xiàn):2018-01-06中,我提到老板讓我讀的文章里的ChIP-Seq找peak是作者他們自己寫腳本完成的,但其實(shí)在2年前的2008年劉小樂實(shí)驗(yàn)室就發(fā)了ChIP-Seq找peak的工具,也就是大家耳熟能詳?shù)腗ACS(目前是MACS2)。
ChIP-Seq盡管有很多好處,但是也有幾個(gè)問題不得不說
- 當(dāng)時(shí)由于測序的read(文章稱之為tags)大多是25~50bp,所以僅僅標(biāo)識(shí)的是ChIP片段的末尾,而不是真實(shí)的蛋白-DNA結(jié)合位點(diǎn)。(這解答我之前的困惑,為啥要在3‘要延長到130bp。盡管read鏈信息和蛋白實(shí)際結(jié)合位點(diǎn)的近似信息能夠提高peak的清晰度,但是問題在于如何估計(jì)read和實(shí)際結(jié)合位點(diǎn)。
- 由于測序和比對偏差,ChIP-Seq存在基因組區(qū)域性偏好,比如說染色質(zhì)結(jié)構(gòu)和基因組拷貝數(shù)變異。該問題可以通過對對照組的深度測序后建模來處理。
MACS包聲稱能夠搞定解決以上問題,這里看下他們的模型的設(shè)計(jì)思路。
ChIP-Seq reads的偏移距離建模(Modeling the shift size of ChIP-Seq tags)
閱讀下文前,請記住當(dāng)年基本都用單端測序, 測序長度大概為50bp。
ChIP-Seq得到的read是ChIP DNA文庫片段里的末尾,為了更好的表示蛋白-DNA結(jié)合位點(diǎn),通常要往3'端偏移一定距離。這個(gè)距離是多少,大多是不知道的,所以我在每日文獻(xiàn):2018-01-06看到他們根據(jù)經(jīng)驗(yàn)全部偏移到130bp。
但是由于ChIP-Seq的文庫片段兩端被測序的概率相同的(當(dāng)時(shí)是單端),也就是真實(shí)的結(jié)合區(qū)域上的reads會(huì)形成雙峰(bimodal enrichment pattern),也就是Waston鏈會(huì)在上富集,Crick鏈會(huì)在下游富集。

于是作者根據(jù)超聲打斷的平均條帶長度(bandwidth)和高可信度倍數(shù)富集區(qū)域(mfold)在全基因組上以2_bandwidth_進(jìn)行掃描,找到盡可能可信的mfold,選取這些片段計(jì)算雙峰距離(d), 最后read的偏移距離就是d/2.
我的問題是,現(xiàn)在PE150bp還需要考慮這個(gè)read偏移嗎?
檢測peak
如果有對照,MACS會(huì)把對照組的reads count縮放(scale)為ChIP-Seq tag count一樣多. 并且MACS會(huì)根據(jù)測序深度(二項(xiàng)分布p值<10e-5)自動(dòng)去重.
作者用泊松分布對read進(jìn)行建模, 在染色體上以2 d(雙峰之間距離)為Windows,以偏移以后的reads作為輸入,尋找可能的peak,并且peak里要有足夠富集的reads. 當(dāng)然和我之前讀的文獻(xiàn)里簡單粗暴的把lambda設(shè)為局部的平均深度(即所有堿基的覆蓋深度除以堿基總數(shù))不同, 作者觀察到read的分布式存在局部波動(dòng)和偏差的,比如說所用的FoxA1的候選peak里, read count在ChIP和對照組之間是相關(guān)的. 這可能是局部染色質(zhì)結(jié)構(gòu),DNA擴(kuò)增和測序偏差和拷貝數(shù)變異所引起.

作者就想到了使用動(dòng)態(tài)的 local lambda進(jìn)行優(yōu)化.

最后的多重實(shí)驗(yàn)矯正(FDR),作者使用的是之前ChIP-chip peak finder工具M(jìn)AT和MA2C.