本周文獻(xiàn)-181130:lncRNA

文獻(xiàn)信息

標(biāo)題:Global identification of Arabidopsis lncRNAs reveals the regulation of MAF4 by a natural antisense RNA

DOI(url): 10.1038/s41467-018-07500-7

發(fā)表日期:29 November 2018

關(guān)鍵詞:lncRNA, H3K4me3, natural antisense transcripts, concordantly expressed

文獻(xiàn)概述

  • 鑒定了 6510 個(gè) lncRNA ,其中包括 4050 個(gè) NAT-lncRNA 以及 2460 個(gè) lincRNA
  • 在不同組織或逆境處理?xiàng)l件下,很多 NAT-lncRNA 與鄰近蛋白編碼基因的表達(dá)呈現(xiàn)正相關(guān)趨勢。
  • 通過人工 miRNA 沉默部分 NAT-lncRNA 表達(dá)可導(dǎo)致鄰近蛋白編碼基因表達(dá)下降,表明 NAT-lncRNA 可正向調(diào)控鄰近基因的表達(dá)。
  • 擬南芥成花抑制基因 MADS AFFECTING FLOWERING4(MAF4) 基因位點(diǎn)有一個(gè) NAT-lncRNA,MAS。
  • MAS 受冷處理誘導(dǎo)并在轉(zhuǎn)錄水平激活 MAF4 表達(dá),抑制擬南芥過早開花。MAS 對 MAF4 的激活依賴于一類參與組蛋白 H3K4me3 修飾的 COMPASS-like 復(fù)合體。
  • MAS 與復(fù)合體中的一個(gè)核心蛋白組分 WDR5a 結(jié)合并輔助該復(fù)合體招募到MAF4 基因位點(diǎn),促進(jìn) H3K4me3 修飾,從而促進(jìn) MAF4 表達(dá)。

筆記

文章主要內(nèi)容和結(jié)論

測序和建庫類型,作者使用了三種建庫方式,分別是去rRNA, poly(A)+ 和 poly(A)? 。

using high-depth strand-specific RNA sequencing (ssRNA-seq). We generated cDNA libraries for rRNA-depleted total, polyadenylated [poly(A)+] and non-polyadenylated [poly(A)?] RNAs in whole cell extract, nuclear and cytosolic fractions

對轉(zhuǎn)錄本進(jìn)行拼接,從64,987 genomic loci 找到了106,421 unique transcripts。

106,421 unique transcripts from 64,987 genomic loci. Among these, 25,245 were previously annotated protein-coding transcripts

去除掉編碼 RNA,已知的非編碼 RNA,短于150bp以及最大 FPKM < 1 的轉(zhuǎn)錄本以及編碼能力大于0的轉(zhuǎn)錄本以及和編碼 RNA 在同一個(gè)方向并且有部分重疊的部分,剩下一共注釋了 6510 個(gè) lncRNAs。這里面的數(shù)據(jù)包括了不同組織和不同脅迫處理。

找到了lncRNA之后必然需要進(jìn)行一些泛泛的統(tǒng)計(jì)和分類。首先作者把 NAT lncRNA 分成了3類:overlapping (2117), divergent (1296) and convergent (637)。具體每一類的特點(diǎn)如下圖所示。

分類

隨后作者統(tǒng)計(jì)了 lncRNA 特征并和可以翻譯的進(jìn)行了對比,總之就是長度短外顯子少isoforms 也少,當(dāng)然表達(dá)量也低。作者也檢查了植物(擬南芥)里的lncRNA 到底有沒有 polyA 尾巴。在我之前的認(rèn)知里感覺很多 lncRNA 是沒有polyA 的,但是作者的通過對兩種建庫方式進(jìn)行嚴(yán)格篩選后發(fā)現(xiàn)大部分的lncRNA 其實(shí)是有 polyA 尾巴的。具體信息如下:

we found that 1352 lncRNAs were significantly enriched in the poly(A)+ fraction, whereas 198 lncRNAs were significantly enriched in the poly(A)? fraction

我沒有想到的一個(gè)統(tǒng)計(jì)指標(biāo)是作者對 lncRNA 的核質(zhì)分布情況進(jìn)行了分析,發(fā)現(xiàn)細(xì)胞核比細(xì)胞質(zhì)多的 lncRNA 要多一些。

239 lncRNAs had significantly higher levels in the nuclear fraction than that in the cytosolic fraction, whereas only 43 lncRNAs were more abundant in the cytosolic fraction

lncRNA 的表達(dá)特異性自然肯定也是要做的,包括不同組織和不同脅迫條件,文章特別提到了也驗(yàn)證出 COOLAIR 冷處理后表達(dá)量會(huì)升高。

至此都是比較平淡的信息,隨后的結(jié)論就開始逐漸接觸正題。

關(guān)于 lncRNA 和 adjacent genes 的關(guān)系一直爭論,有抑制的也有促進(jìn)的,各自都有一些實(shí)驗(yàn)結(jié)果支撐??赡苣壳暗慕Y(jié)論就是二者都有。作者計(jì)算了他找到的lncRNA 和對應(yīng)的基因之間的相關(guān)性,發(fā)現(xiàn)只要 NAT 相關(guān)性系數(shù)就要比不是 NAT 的高很多,而且還是正相關(guān)。

整個(gè)文章中所有的高通量分析數(shù)據(jù)作者每一步都挑了若干個(gè) RT-qPCR 進(jìn)行驗(yàn)證。不知道是不是 review 的要求。

We found that the p.c.c. values of overlapping NAT-lncRNA/sense gene pairs were significantly higher than the values between adjacent protein-coding pairs (Fig. 3a), suggesting that overlapping NAT-lncRNAs have a stronger tendency to have positively correlated expression patterns with their sense overlapping genes

正相關(guān)還說明不了什么。為了證明是正調(diào)控,作者使用 artificial microRNAs knocked down 21 NAT-lncRNAs。 發(fā)現(xiàn),其中 15 個(gè) cognate sense genes顯著下調(diào),3 個(gè)上調(diào)。

有了現(xiàn)象就要解釋結(jié)論,目前關(guān)于 lncRNA 的作用機(jī)制其實(shí)已經(jīng)有不少了,比如當(dāng)做一個(gè)靶點(diǎn)替編碼基因吸引敵人,或者通過R-loop 來發(fā)揮作用。當(dāng)然,如果一個(gè)現(xiàn)象用正常的方法很難解釋,有一個(gè)挺不錯(cuò)的萬金油就是用表觀遺傳學(xué)來解釋,這里的萬金油是個(gè)中性詞,我自己就是做表觀遺傳的。

作者想要說明 lncRNA 能夠正向調(diào)節(jié)對應(yīng)的編碼基因,那么最好的方法就是看看是不是和一些類似于H3K4me3 的激活型修飾聯(lián)系起來。隨后作者很「自然」的focus 到了一個(gè)叫做 MAF4 的基因,對應(yīng)的NAT 叫做 MAS,至于為什么要做這個(gè)基因也沒什么解釋。

MAS結(jié)構(gòu)

首先作者用實(shí)驗(yàn)證明了這兩個(gè)轉(zhuǎn)錄本到底是編碼的調(diào)控了非編碼的還是反之,然后嘗試分析了一些機(jī)制,比如會(huì)不會(huì)雙鏈RNA 產(chǎn)生的 sRNA,或者影響了編碼RNA的穩(wěn)定性。然后通過若干的實(shí)驗(yàn)證明了順式作用MAS在轉(zhuǎn)錄水平激活MAF4表達(dá)。 因?yàn)橐阎狧3K4me3 參與了MAF4 的激活,所以作者就像是不是可以把這個(gè)NAT 和 H3K4me3 聯(lián)系一下。然后又進(jìn)行了一系列實(shí)驗(yàn)驗(yàn)證。表明確實(shí)在MAS 的突變體中這個(gè)表觀修飾有變化且一個(gè)相關(guān)的復(fù)合體因子很重要。

模式圖

討論部分幾點(diǎn)信息

從討論部分可以發(fā)現(xiàn),作者找到的組蛋白 H3K4me3 修飾的 COMPASS-like 復(fù)合體核心蛋白組分 WDR5a 之前已經(jīng)在Nature 中被報(bào)道過和其它的 lncRNA 存在作用,但是找到的機(jī)制不同。另外,作者的結(jié)果與先前的發(fā)現(xiàn)一致,即相鄰基因通常具有相關(guān)表達(dá),而與其方向無關(guān)。

另外,作者也提到了基因之間的“ripple effects ”, 至于原因可能是因?yàn)镹AT-lncRNA的TSS與其配對基因之間的平均距離較小,也可能是NAT-lncRNAs在激活其配對基因的表達(dá)中確實(shí)起著至關(guān)重要的作用。

主要方法

作者在計(jì)算表達(dá)量的時(shí)候用的還是 Cuffidff, 我并不是反感 Cuffdiff 但是我看到它就會(huì)想到 Tophat2 ,果然在2018年作者使用的 mapping 軟件還是 TopHat2。轉(zhuǎn)錄組拼接用的也是cufflinks 和 cuffmerge 那一套。

R 的版本是3.1.0, 這一版 R 的更新日期要追溯到2014年4月10號(hào)了, 我猜測要么是這個(gè)文章的時(shí)間跨度確實(shí)已經(jīng)有三四年了,或者是他們實(shí)驗(yàn)室沒有一個(gè)真正做生物信息且對軟件版本有強(qiáng)迫癥的人。不過從使用的比對軟件來看,也有可能是一個(gè) pipeline 流傳了很多年,祖?zhèn)鞔a。

相關(guān)性計(jì)算使用的是 Pearson correlation coefficients,sRNA-seq 用的是 bowtie allowing no mismatches,然后定量單位是reads per million (RPM)。

比較關(guān)心的幾個(gè)問題

  • RT-qPCR 的時(shí)候如何區(qū)分正負(fù)鏈

  • 如何保證amiRNAs 影響反義鏈的時(shí)候不影響正義鏈的基因表達(dá)

    關(guān)于這個(gè)問題,作者在文章中給了正面的回答

    Alteration of sense gene expression in amiRNA knockdown lines was not due to targeting of sense genes by amiRNA*s. Eight out of 21 amiRNA*s do not base pair with sense mRNAs at all. The rest of the amiRNA*s have mismatches to corresponding sense mRNAs at critical positions。 Furthermore, most of the amiRNA*s do not have 5’ terminal uridine , making it less likely that they are loaded into the effector AGO1 to suppress gene expression

  • 作者在文章中看似自然的從宏觀層面過度到了一個(gè)具體的基因,然后講了一個(gè)NAT 和表觀的故事。比較好奇的是其他十幾個(gè)也找到正向調(diào)控的幾組為什么都沒有提到呢?如果按照正常的套路,一方面可能是他們先做了這個(gè)基因然后發(fā)現(xiàn)有l(wèi)ncRNA 可能參與才有了文章開頭的高通量試驗(yàn),另一方面可能是其他的基因也做了,但是似乎表觀又解釋不了。

  • 文章中關(guān)于 ChIP 的部分并沒有做高通量試驗(yàn),或者做了至少?zèng)]有放在文章中,只是用ChIP-qPCR 去驗(yàn)證。只要做一個(gè)ChIP-seq 的實(shí)驗(yàn)很容易看看其他十幾個(gè)基因的修飾情況,甚至可以K27, K36 這些修飾都做一做。如果能有一半的基因做出表觀的相關(guān)性,我都會(huì)更相信這個(gè)機(jī)制。

review 怎么看

nature 系列的雜志目前似乎可以公開作者和文章review 之間的質(zhì)疑和回應(yīng)內(nèi)容,在這篇文章的附件中可以看到完整的review 意見,其中「如何保證amiRNAs 影響反義鏈的時(shí)候不影響正義鏈的基因表達(dá)」也是review 的問題。

個(gè)人感覺仔細(xì)閱讀 review 和 作者之間溝通的這個(gè)記錄比閱讀原文更有意思。

相關(guān)文獻(xiàn)

植物中研究的比較多的幾個(gè)lncRNA

  • COLDAIR: Swiezewski, S., Liu, F., Magusin, A. & Dean, C. Cold-induced silencing by long antisense transcripts of an Arabidopsis Polycomb target. Nature 462, 799–802 (2009).

  • APOLO: Ariel, F. et al. Noncoding transcription by alternative RNA polymerases dynamically regulates an auxin-driven chromatin loop. Mol. Cell 55, 383–396 (2014).

  • ELENA: Seo, J. S. et al. ELF18-INDUCED LONG-NONCODING RNA associates with mediator to enhance expression of innate immune response genes in Arabidopsis. Plant Cell 29, 1024–1038 (2017).


掃碼即刻交流
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容