RNA velocity of single cells
文獻(xiàn)閱讀篇 1
RNA豐度是單個(gè)細(xì)胞狀態(tài)的有力指標(biāo)。單細(xì)胞RNA測(cè)序可以顯示RNA豐度,這種方法定量準(zhǔn)確性高,靈敏度高,通度高。但是,這種方法只能在某個(gè)時(shí)間點(diǎn)捕獲靜態(tài)快照,這對(duì)分析時(shí)間層級(jí)的現(xiàn)象(例如胚胎發(fā)生或組織再生)提出了挑戰(zhàn)。
在這里,我們提出,可以通過(guò)區(qū)分常見(jiàn)單細(xì)胞RNA測(cè)序方案中Unspliced mRNAs和Spliced mRNAs來(lái)直接估計(jì)RNA velocity(基因表達(dá)狀態(tài)的時(shí)間導(dǎo)數(shù))。
RNA velocity是一個(gè)高維向量,可以在幾小時(shí)的時(shí)間尺度上預(yù)測(cè)單個(gè)細(xì)胞的未來(lái)狀態(tài)。 我們?cè)谏窠?jīng)脊譜系中驗(yàn)證其準(zhǔn)確性,展示其在多個(gè)已公開(kāi)數(shù)據(jù)集和技術(shù)平臺(tái)上的應(yīng)用,揭示發(fā)育中小鼠海馬的分支譜系樹(shù),并檢查人類胚胎腦中的轉(zhuǎn)錄動(dòng)力學(xué)。 我們期望RNA velocity能夠極大地幫助分析發(fā)育譜系和細(xì)胞動(dòng)力學(xué),尤其是在人類中。
Fig.1

該圖展示了單細(xì)胞測(cè)序數(shù)據(jù)中能夠檢測(cè)到部分Unspliced reads。覆蓋到內(nèi)含子區(qū)域的reads即為Unspliced reads。紅色為占比。

該圖提出了用于推斷RNA velocity的重要公式。在某時(shí)刻,以α速率產(chǎn)生u個(gè)Unspliced mRNA,以β速率對(duì)Unspliced mRNA進(jìn)行剪切,以γ速率對(duì)Spliced mRNA進(jìn)行降解。取β = 1,也就是所有速率的測(cè)量都以β作為基準(zhǔn)。

該圖展示了u(Unspliced mRNA數(shù)目),s(Spliced mRNA數(shù)目)跟隨α進(jìn)行變化的示意圖,符合常理。

該圖反應(yīng)了兩種趨勢(shì)。1. 當(dāng)u > γs時(shí),ds/dt大于0,s越來(lái)越大,直到u = γs。2. 當(dāng)u < γs時(shí),ds/dt小于0,s越來(lái)越小,直到u = γs。直覺(jué)上講,當(dāng)u很大時(shí),必然需要提高剪切速率,產(chǎn)生s,最終相等。而當(dāng)u較少時(shí),剪切產(chǎn)生的s不如降解的多,必然會(huì)導(dǎo)致s的減少,最終相等。因此,每個(gè)基因在瞬時(shí)都有u = γs的趨勢(shì)。

該圖反映了,基因的u與下一時(shí)間點(diǎn)基因的s模式相似。

左圖為Fgf1基因,右圖為Cbs基因。能夠看出基因表達(dá)隨時(shí)間的變化確實(shí)對(duì)
u = γs有趨向性。

該圖的箭頭表示了基因的表達(dá)從觀察狀態(tài)到t時(shí)刻的預(yù)測(cè)狀態(tài)的趨向性。因?yàn)轭A(yù)測(cè)是對(duì)每個(gè)基因?qū)崿F(xiàn)的,因此通過(guò)PCA降維對(duì)數(shù)據(jù)進(jìn)行展示。從圖中可以看出,箭頭的指向性與真實(shí)t時(shí)刻后的基因表達(dá)較為類似。
Fig.2

該圖為小鼠雪旺細(xì)胞前體分化成嗜鉻細(xì)胞的PCA降維分類圖。

該圖為Serpine2基因(表達(dá)下調(diào)), Chga基因的(表達(dá)上調(diào))。從圖中可以看出,Serpine2基因在分化前的細(xì)胞中u > γs,隨后u逐漸減少,最終消失。positive residuals表明預(yù)期上調(diào), negative residuals表明預(yù)期下調(diào)。

RNA velocity以箭頭進(jìn)行標(biāo)注,大致展示了時(shí)間層級(jí)的信息。

在本例中通過(guò)概率計(jì)算選擇最合適的計(jì)算時(shí)間,2.1h。

在tSNE中使用近鄰細(xì)胞進(jìn)行池化操作估計(jì)的RNA velocity。
Fig.3

小鼠海馬細(xì)胞tSNE作圖,b中中間圖表明基因表達(dá)預(yù)期上調(diào)還是下調(diào)(positive還是negative),右圖表明Spliced mRNA數(shù)量。

tSNE與RNA velocity的結(jié)合。右上角展示了通過(guò)馬爾科夫過(guò)程導(dǎo)致的稠密區(qū)域,代表了分化終點(diǎn)。
該圖展示了RNA velocity在沒(méi)有先驗(yàn)發(fā)育過(guò)程知識(shí)下確定系譜樹(shù)方向的能力。

從紅色點(diǎn)細(xì)胞到達(dá)相鄰細(xì)胞的單步概率可視化。
該圖展示了細(xì)胞命運(yùn)決定的過(guò)程,細(xì)胞命運(yùn)的選擇很可能是一個(gè)不確定的過(guò)程,基因表達(dá)傾向于一個(gè)或另一個(gè)命運(yùn),然而一旦轉(zhuǎn)錄因子反饋循環(huán)建立就變成了一個(gè)鎖定的最終命運(yùn)。
Fig.4

人類谷氨酸能神經(jīng)元分化圖。

偽時(shí)間表達(dá)譜。不論是上調(diào)還是下調(diào),Unspliced mRNAs始終先于Spliced mRNAs。同時(shí),能夠發(fā)現(xiàn)RNASEH2B基因的轉(zhuǎn)錄動(dòng)力學(xué)很快。而DCX、ELAVL4和STMN2等基因顯示了快速的轉(zhuǎn)錄爆發(fā),隨后持續(xù)的轉(zhuǎn)錄水平降低,Spliced mRNAs明顯呈延遲軌跡。
結(jié)論
這一方法有望為我們理解細(xì)胞基因表達(dá)在分化過(guò)程中的動(dòng)態(tài)提供更堅(jiān)實(shí)的定量基礎(chǔ)。