我們現(xiàn)在知道,當(dāng)RNA被包裹在囊泡中或通過(guò)與脂蛋白或RNA結(jié)合蛋白結(jié)合時(shí),它可以在生物液體的惡劣環(huán)境中生存下來(lái)。這些細(xì)胞外RNA(exRNA)在細(xì)胞間信號(hào)轉(zhuǎn)導(dǎo)中發(fā)揮作用,作為疾病的生物標(biāo)志物,并形成疾病治療新策略的基礎(chǔ)。
細(xì)胞外RNA通信聯(lián)盟(ERCC)舉辦了一個(gè)為期兩天的在線研討會(huì)(2021年4月19-20日),內(nèi)容是細(xì)胞外RNA數(shù)據(jù)分析的獨(dú)特挑戰(zhàn)。其目標(biāo)是促進(jìn)一個(gè)關(guān)于最佳實(shí)踐的開(kāi)放對(duì)話,并討論該領(lǐng)域的開(kāi)放問(wèn)題,最初主要關(guān)注小的exRNA測(cè)序數(shù)據(jù)。
可提供研討會(huì)介紹和討論的錄像(https://exRNA.org/exRNAdata2021-videos/)。
有三個(gè)目標(biāo)受眾:
- 生成exRNA測(cè)序數(shù)據(jù)的實(shí)驗(yàn)人員
- 與這些小組一起分析數(shù)據(jù)的計(jì)算和數(shù)據(jù)科學(xué)家
- 以及該領(lǐng)域的實(shí)驗(yàn)和數(shù)據(jù)科學(xué)家
在這里,我們總結(jié)了研討會(huì)期間探討的問(wèn)題,包括開(kāi)發(fā)exRNA數(shù)據(jù)分析挑戰(zhàn)的努力進(jìn)展,以參與社區(qū)解決這些開(kāi)放的問(wèn)題。
文章信息
- 文獻(xiàn)標(biāo)題:Open Problems in Extracellular RNA Data Analysis: Insights From an ERCC Online Workshop
- Doi:10.3389/fgene.2021.778416
- 發(fā)表時(shí)間: Frontiers in Genetics 03 January 2022
- 通訊作者:
- Ryan M. Spengler 威斯康星大學(xué)麥迪遜分校醫(yī)學(xué)和公共衛(wèi)生學(xué)院
- 細(xì)胞外RNA通信聯(lián)盟 Roger P. Alexander
ERCC來(lái)源介紹
2013年,美國(guó)國(guó)立衛(wèi)生研究院共同基金啟動(dòng)了細(xì)胞外RNA通信聯(lián)盟,以促進(jìn)對(duì)細(xì)胞外RNA的基礎(chǔ)生物學(xué)及其在疾病診斷和治療中的臨床應(yīng)用的研究。第一階段的一個(gè)產(chǎn)品,ERCC1(2013-2018),是exRNAAtlas,一個(gè)包含小rna測(cè)序和RT-qPCR數(shù)據(jù)的數(shù)據(jù)庫(kù)。迄今為止,該地圖譜包含了來(lái)自14種生物液體和16種疾病的7700多份樣本。
目前的階段,ERCC2,重點(diǎn)關(guān)注于表征外RNA載體和分離、表征單個(gè)胞外囊泡(ev)含量的技術(shù)的發(fā)展。exRNA圖譜的一個(gè)關(guān)鍵優(yōu)勢(shì)是,小RNA-seq數(shù)據(jù)集由細(xì)胞外RNA處理工具包(ecepRpt)統(tǒng)一處理。
從ERCC1中得到的一個(gè)慘痛教訓(xùn)是,很難從數(shù)據(jù)中根除系統(tǒng)偏差,這使得比較不同條件下的exRNA譜變得困難。2021年4月舉行了在線研討會(huì),以解決exRNA數(shù)據(jù)分析中的這些問(wèn)題和其他問(wèn)題。

exRNA數(shù)據(jù)分析中的開(kāi)放問(wèn)題
1.一個(gè)關(guān)鍵的挑戰(zhàn)是:不同的實(shí)驗(yàn)方法之間的exRNA數(shù)據(jù)質(zhì)量有很大和系統(tǒng)的差異
從實(shí)驗(yàn)樣本中分離和純化exRNA和細(xì)胞外囊泡(ev)本身是困難的,用于這些任務(wù)的RNA分離試劑盒被認(rèn)為是由此產(chǎn)生的exRNA數(shù)據(jù)可變性的一個(gè)主要來(lái)源。補(bǔ)償這種變異是一個(gè)核心挑戰(zhàn),因?yàn)槊糠N試劑盒和RNA測(cè)序方法都有不同的序列偏差,這在進(jìn)行更大規(guī)模的分析時(shí)必須加以解釋。
Dr. Kitchen強(qiáng)調(diào),在盡可能使用相同方法制備的樣品中,應(yīng)該嘗試比較不同樣品中的exrna的相對(duì)數(shù)量。即便如此,exRNA載體豐度的大樣本-樣本差異仍然存在,這掩蓋了病例對(duì)照研究中的生物信號(hào)。
2.在exRNA和EV生物學(xué)中,另一個(gè)有趣的中心問(wèn)題是確定生物流體中不同的exRNA簇起源的組織和細(xì)胞類型
Dr. Kitchen認(rèn)為,在尿液和唾液等外周生物液體中可能存在,但在循環(huán)血清和血漿中更具挑戰(zhàn)性,在那里,exRNA 成分可能過(guò)于多樣化而無(wú)法分析。對(duì)于囊泡外rna,這個(gè)問(wèn)題應(yīng)該通過(guò)改進(jìn)分離EV亞組分的實(shí)驗(yàn)技術(shù)來(lái)簡(jiǎn)化,如選擇具有細(xì)胞類型特異性表面蛋白的EV。然而,隨著分餾技術(shù)的改進(jìn),將有必要補(bǔ)償可變的富集效率。
3.非編碼RNA注釋的質(zhì)量
Juan Pablo Tosar特別關(guān)注了非編碼RNA注釋的質(zhì)量。他概述了miRNA和piRNA的生物發(fā)生機(jī)制是如何作為miRbase等現(xiàn)有注釋的基礎(chǔ)的。問(wèn)題是,這樣的數(shù)據(jù)庫(kù)往往缺乏嚴(yán)格的管理,導(dǎo)致許多序列在任何合理的定義下都不是miRNAs或piRNAs。
Tosar描述了兩個(gè)來(lái)自miRbase注釋的兩個(gè)例子,表明miR-1202實(shí)際上是小核仁RNA,SNORD126和miR-1246,一種富含ev的microRNA,可能是細(xì)胞培養(yǎng)基中胎牛血清(FBS)的污染物,也可能是小核RNARNU2-1的片段。
Tosar強(qiáng)調(diào),piRNAs具有復(fù)雜的生物發(fā)生機(jī)制,具有強(qiáng)烈的偏倚,以U開(kāi)頭或在第10位有A,它們從具有高密度piRNA序列的基因組簇中表達(dá)。PiRNA主要在性腺和早期胚胎中表達(dá),它們的主要作用是抑制轉(zhuǎn)座因子的表達(dá)。然而,現(xiàn)有的piRNA數(shù)據(jù)庫(kù)中有極少數(shù)(<1%)的污染序列不符合這些標(biāo)準(zhǔn),并且與其他ncRNA家族有100%的重疊(Tosar等人,2018a)。在癌癥和生物體液中發(fā)現(xiàn)的piRNA表達(dá)通常在這組假陽(yáng)性污染物的序列中高度富集。
exRNA數(shù)據(jù)源
在一次關(guān)于exRNA數(shù)據(jù)源的會(huì)議上,Matt Roth概述了ERCC的exRNA圖譜:從廣泛的生物液體和疾病狀態(tài)中產(chǎn)生的外顯RNA測(cè)序和qPCR數(shù)據(jù)的精選目錄。
Roth概述了exRNA圖譜的特性,它便于訪問(wèn)、查詢、解釋和重用實(shí)驗(yàn)數(shù)據(jù)和樣本元數(shù)據(jù)。他還描述了正在進(jìn)行的努力,以擴(kuò)展圖集內(nèi)容,包括作為ERCC2的一部分正在開(kāi)發(fā)的其他exRNA技術(shù)的數(shù)據(jù)和元數(shù)據(jù),并將exRNA圖集數(shù)據(jù)集成到NIH共同基金數(shù)據(jù)生態(tài)系統(tǒng)(https://app.nih-cfde.org/)中。
Justin Chang預(yù)覽了exRNA探索器工具,這是一個(gè)數(shù)據(jù)探索和可視化工具,很快將被集成到公開(kāi)的exRNA圖譜中。 Joel Rozowsky 后來(lái)在exRNA圖譜中概述了用于處理短exRNA測(cè)序數(shù)據(jù)的超越管道。
Pieter Mestdagh展示了人類生物流體RNA圖譜(Hulstaert等人,2020年),該圖譜使用小RNA測(cè)序和mrna捕獲測(cè)序來(lái)描述和比較了各種生物液體(n=20)中的exRNA轉(zhuǎn)錄組譜。
-
通過(guò)計(jì)算反褶積,可以將exRNA譜分解為貢獻(xiàn)組織,這是稍后在研討會(huì)上深入探討的主題。他表明,反褶積的準(zhǔn)確性取決于幾個(gè)因素,包括(Mestdagh還提出證據(jù)表明,環(huán)狀rna(環(huán)狀rna)存在于生物液體中,相對(duì)于線性轉(zhuǎn)錄本的豐度比例可能高于細(xì)胞和組織中)
- 1)exRNA-seq read count適當(dāng)轉(zhuǎn)換和歸一化,
- 2)反褶積算法的選擇和
- 3)參考數(shù)據(jù)的質(zhì)量和完整性。
Klaas Max討論了血清和血漿中細(xì)胞外miRNA的健康參考譜,Max注意到,健康受試者中許多最可變的miRNAs是細(xì)胞譜系肝臟、神經(jīng)內(nèi)分泌器官、腎上腺、上皮細(xì)胞和肌肉的特異性miRNAs。具有共同起源的幾個(gè)這樣的miRNAs的豐度是中度相關(guān)的。盡管他們發(fā)現(xiàn)了其他可變表達(dá)的miRNAs, Max指出,已知的miRNAs很少是細(xì)胞譜系特異性的,這使得去卷積和識(shí)別起源組織的方法變得復(fù)雜。血漿通過(guò)超離心分離富集非造血mirna,并沒(méi)有導(dǎo)致器官或細(xì)胞型?特異性mirna的強(qiáng)烈富集
exRNA-SEQ處理
1.外源性exRNA
微生物RNA污染:Karolina El?bieta Kaczor-Urbanowicz研究團(tuán)隊(duì)收集了2000份來(lái)自GC患者和非GC對(duì)照組的唾液樣本,并注意到唾液中微生物RNA的比例遠(yuǎn)高于其他生物液體。因此,對(duì)于ERCC的exceRpt管道的質(zhì)量控制(QC)標(biāo)準(zhǔn)必須進(jìn)行修改,以考慮到不成比例的高微生物RNA含量。該研究團(tuán)隊(duì)評(píng)估了是在映射到人類基因組之前還是之后,將RNA-seq讀取的數(shù)據(jù)映射到微生物RNA上。他們發(fā)現(xiàn),處理唾液長(zhǎng)RNA-seq數(shù)據(jù)的最好方法是首先映射到微生物組,并在映射到人類之前去除比對(duì)上的細(xì)菌序列。
識(shí)別污染:研究還人員發(fā)現(xiàn),通過(guò)進(jìn)行反褶積和方差劃分分析來(lái)分離外來(lái)的變異源,可以提高他們識(shí)別exRNA生物標(biāo)記物的能力
2.exRNA文庫(kù)制備的注意事項(xiàng)
Ryan Spingler強(qiáng)調(diào)標(biāo)準(zhǔn)的小RNA-seq庫(kù)制備方法要求rna具有5‘磷酸和3’羥基,但相當(dāng)一部分exrna缺乏這些末端化學(xué)修飾。Spengler在連接接頭前用多核苷酸激酶(polynucleotide kinase, PNK,DNA及RNA 5′末端的標(biāo)記)孵育RNA池,發(fā)現(xiàn)exRNA轉(zhuǎn)錄組圖譜發(fā)生了顯著變化,例如血漿中mRNA和lncRNA片段的數(shù)量顯著增加。
這些片段可能來(lái)自于mRNA轉(zhuǎn)錄的特定區(qū)域,這些區(qū)域不受RNase(核糖核酸酶能催化核糖核酸(RNA)的降解)的降解,且在樣本間也不受RNase降解的區(qū)域類似。
仔細(xì)過(guò)濾reads映射到重復(fù)和非人類序列對(duì)于識(shí)別真正的mRNA片段至關(guān)重要。在一項(xiàng)造血干細(xì)胞移植受者的縱向研究中,mRNA片段分離成幾個(gè)不同的時(shí)間共表達(dá)signatures,與轉(zhuǎn)錄本可能的起源組織(即肝臟和骨髓)相關(guān)。
3.生物標(biāo)志物發(fā)現(xiàn)
Leonora Balaj討論了識(shí)別與膠質(zhì)瘤相關(guān)的細(xì)胞外mRNA signatures的成就。
他們檢測(cè)了從膠質(zhì)瘤患者分離的ev中提取的RNA-seq長(zhǎng)序列,并將其與年齡和性別匹配的健康個(gè)體進(jìn)行比較。他們還展示了一種兩種混合捕獲方法,使用外顯子組panels從蛋白質(zhì)編碼的mrna中富集exRNA reads。包括核糖體RNA去除步驟,他們能夠大量富集mRNA序列,并在很大程度上消除非捕獲文庫(kù)中占主導(dǎo)地位的非mRNA reads。
4.小RNA Clusters從頭發(fā)現(xiàn)
exRNA和RNA結(jié)合蛋白
在生物液體中循環(huán)的細(xì)胞外RNA必須被保護(hù)起來(lái),使其不受惡劣環(huán)境的影響,特別是不受消化RNA的酶的影響。
- 一些exRNA對(duì)RNase的消化具有抗性,例如,Gly/GlutRNA片段,可以形成穩(wěn)定的同源和異源二聚體
- 其他的exrna在囊泡內(nèi)或通過(guò)與rna結(jié)合蛋白的結(jié)合而受到保護(hù)
- 最近的研究表明,一些細(xì)胞表面的外rna受到糖基化的保護(hù)
RBP相關(guān)的exRNAs一直難以研究,因?yàn)榉蛛x和鑒定人類基因組中數(shù)百個(gè)RBPs的RNA結(jié)合位點(diǎn)需要微妙的蛋白質(zhì)生物化學(xué)。
- Eric Van Nostrand概述了來(lái)自RNA元件百科全書(ENCORE)的資源來(lái)幫助這一工作,包括經(jīng)過(guò)驗(yàn)證的抗體和shRNA試劑
反褶積
該領(lǐng)域的兩個(gè)主要開(kāi)放性問(wèn)題是確定生物液體中exrna的來(lái)源組織,并將其與分子載體聯(lián)系起來(lái),無(wú)論是RNA結(jié)合蛋白,脂質(zhì),如HDL或LDL,還是各種類型的細(xì)胞外囊泡。
計(jì)算反褶積是一種將異構(gòu)數(shù)據(jù)集劃分為不同獨(dú)立成分貢獻(xiàn)的方法,可以補(bǔ)充解決此類挑戰(zhàn)的實(shí)驗(yàn)性方法。反褶積算法有兩大類:基于參考的和無(wú)參考的:
- 基于參考的算法:需要從所有細(xì)胞類型或分子載體中分離出一個(gè)已知的基因表達(dá)譜的簽名矩陣
- 無(wú)參考方法:同時(shí)估計(jì)特征矩陣和混合物中每種細(xì)胞類型或載體的相對(duì)比率
例子:
XDec algorithm:一種兩階段無(wú)參考反褶積算法,將生物流體樣本中的exRNAs分離為與不同分子載體相關(guān)的組——胞外囊泡、脂蛋白HDL和低密度脂蛋白,以及三類RNA結(jié)合蛋白
DAISM-DNN algorithm
CIBERSORTx:baseline reference methods,基于早期的細(xì)胞類型識(shí)別,通過(guò)估計(jì)RNA轉(zhuǎn)錄本的相對(duì)子集(CIBERSORT)算法
數(shù)據(jù)可用性
本研究分析了公開(kāi)可獲得的數(shù)據(jù)集。數(shù)據(jù)來(lái)源包括
- exRNA圖譜(https://exRNA-Atlas.org)
- 人類生物流體RNA圖譜(https://r2.amc.nl)
- 來(lái)自腫瘤反褶積DREAM挑戰(zhàn)的數(shù)據(jù)可在https://www.synapse.org/#!Synapse:syn15589870/wiki/582446上獲得