circRNA差異分析工具: DEBKS

獨(dú)特的環(huán)狀結(jié)構(gòu)讓二代測序較短的讀長限制了對其鑒定以及定量,目前僅僅依靠其反向剪切序列;另外,環(huán)狀RNA的表達(dá)總是與來源基因(host gene)線性RNA的表達(dá)糾纏不清,讓我們很難區(qū)分差異是來源于反向剪切還是只是來源基因的副產(chǎn)物。
對此,許多軟件在識別上下功夫,比如DCC、CIRCexplorer、CIRI等等,然后用DESeq2或edgeR進(jìn)行差異分析;而另一些軟件在定量上使勁,對環(huán)狀 RNA 的定量不僅僅使用反向剪切序列(BSJ),而且考慮到來源基因線性分子表達(dá)的影響,使用BS ratio進(jìn)行定量,例如DCC、CIRI2、CIRIquant以及CLEAR。當(dāng)然這種定量就不適合用于DESeq2或edgeR,一般可以用DCC::CircTest或CIRIquant等軟件進(jìn)行差異分析。

DEBKS介紹

最近北大基礎(chǔ)醫(yī)學(xué)院楊恩策團(tuán)隊提出了環(huán)狀RNA差異分析的新方法DEBKS,對BS ratio進(jìn)行了優(yōu)化(公式及圖解如下)。

image.png

image.png

對此,DEBKS設(shè)計了4個模塊(見下面的流程圖)

  1. merge,整合不同樣品的環(huán)狀RNA
  2. count,對來源基因的線性RNA進(jìn)行定量
  3. anno,評估環(huán)狀RNA長度
  4. dec,檢測差異表達(dá)環(huán)狀RNA

以及兩個差異表達(dá)模式

  1. paired,配對的樣品
  2. unpaired,非配對的樣品
image.png

性能評估

作為一款工具,我們需要首先對其性能進(jìn)行評估。

作者首先用了兩套公共數(shù)據(jù)集檢測了DEBKS識別差異環(huán)狀RNA的檢出率并用RT-qPCR進(jìn)行了驗(yàn)證;隨后,用模擬數(shù)據(jù)對DEBKS以及其他軟件進(jìn)行了評估,評估內(nèi)容包括

  1. 重復(fù)樣品表達(dá)一致性檢驗(yàn)
  2. AUC,真陽性率以及假陽性率
  3. 差異表達(dá)基因檢測敏感性
  4. 來源基因表達(dá)對差異環(huán)狀RNA的影響

通過比較,DEBKS具有更優(yōu)秀的性能并且更少受來源基因表達(dá)的影響。

局限性

由于需要包含線性剪切位點(diǎn)的表達(dá)(LJC),因此,DEBKS只能應(yīng)用于既包含環(huán)狀 RNA又包含線性RNA的測序,例如rRNA-depleted RNA-seq或exome capture RNA-seq。

另外,基因間區(qū)的環(huán)狀RNA由于缺乏線性分子的表達(dá),因此無法用DEBKS評估。

結(jié)束語

雖說目前差異分析幾乎被edgeR/DESeq包攬,然而面對復(fù)雜多樣的生物學(xué)情景以及日益增長的多組學(xué)信息,分析工具的多樣性和特異性是非常有必要的。

環(huán)狀RNA研究越發(fā)蓬勃,然而專門的工具卻仍舊匱乏,另外,有些工具走著走著就丟了。雖然DEBKS在文章中提到表現(xiàn)比較優(yōu)秀,然而能不能成為環(huán)狀RNA研究的利刃,仍需要大量真實(shí)數(shù)據(jù)去檢驗(yàn)。

參考資料:

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容