簡要內(nèi)容
--擬時序分析的定義
--結(jié)果解讀
--------做出結(jié)果(cluster、state)
--------確定起始點(diǎn)
--------做start····end的圖(并且映射到tsne中又一個圖)
--------熱圖和感興趣的-單個基因的動力學(xué)變化趨勢圖
--做擬時序分析的適合的情況
--------細(xì)胞圖譜
--------case control的特征轉(zhuǎn)變
--------重編程或轉(zhuǎn)變軌跡
--文章實(shí)例
--------little tips(遇到三叉口的擬時序分析兩種方法)
首先做細(xì)胞注釋(在project中有了,不再贅述)
一、擬時序分析是什么
通過構(gòu)建細(xì)胞間變化軌跡預(yù)測細(xì)胞隨時間的變化
模擬時間的細(xì)胞序列的分析
時序中細(xì)胞發(fā)生的變化
也不一定非要設(shè)置不同的時間段去做實(shí)驗(yàn)
細(xì)胞本身存在擬時序變化,細(xì)胞是有變化的,才可以做擬時序分析
二、結(jié)果解讀

主成分一和二,根據(jù)高可變基因進(jìn)行排序,
每個點(diǎn)是一個細(xì)胞
左圖按cluster排序,線就是進(jìn)化軌跡
交點(diǎn)1、2,是有節(jié)點(diǎn)的(說明基因有表達(dá)量的差異)
右上按state排序,每個分叉一個state,一個表達(dá)模式
cluster:得到擬時序分析結(jié)果,將cluster映射到結(jié)果中
state:根據(jù)結(jié)果把每個分叉點(diǎn)做命名(表達(dá)模式不同),如下

計算機(jī)沒法判斷起始點(diǎn),要通過生物學(xué)意義(基因表達(dá)和功能)去確定起始點(diǎn),
法一:比如一個case,一個control(對照組),一部分枝杈上case的細(xì)胞數(shù)多(control少),一部分的枝杈上control的細(xì)胞數(shù)多(case少),那么起點(diǎn)就是control,細(xì)胞由control向case轉(zhuǎn)化

法二:判斷每個state或cluster中什么功能的細(xì)胞多,比如乃鸚鵡的到激活型的,,,,某個state中乃鸚鵡的細(xì)胞數(shù)目多,而另一個state中激活型的細(xì)胞數(shù)目多,則乃鸚鵡的那個state為起始點(diǎn)
判斷起始點(diǎn)后,做下面這張圖

這圖與上面的那個cluster映射的圖一樣的形狀,但是下面這個圖時根據(jù)外面認(rèn)為的確定一個起始點(diǎn),顏色越黑的是起始點(diǎn),越黃,隨時間越靠后,然后將這個時間順序映射到tsne中去,黑色的細(xì)胞不斷往淺色的細(xì)胞轉(zhuǎn)換,

時間順序得到之后,接下來可以做熱圖和動力學(xué)變化趨勢圖
熱圖


熱圖最左邊到最右邊就是從起始點(diǎn)到后面的這個動力變化過程中基因的表達(dá)量(基因變化趨勢)變化(最右邊那一列是基因名),左邊那一列是將所有的基因分為了三塊(三種表達(dá)模式),綠色、澄色、藍(lán)色,比如綠色的表達(dá)模式,那些高可變基因的表達(dá)量逐漸減少(表達(dá)量多少的圖是右邊的那個標(biāo)簽,紅色最多,藍(lán)色最少),澄色的部分的表達(dá)量也是隨著時間的流逝,細(xì)胞轉(zhuǎn)化過程中,逐漸減少。藍(lán)色的部分是逐漸增多。
還可以針對感興趣的某個基因做單個基因在里面的變化趨勢

這個圖中縱坐標(biāo)代表表達(dá)量,圖中每個點(diǎn)代表每個細(xì)胞,基因在這些細(xì)胞中的表達(dá)量

左上的基因趨勢不變后來升高,
右上的基因先降低后升高(代表橙色部分)
左下基因一直下降(代表綠色部分)
右下基因一直升高(有可能對應(yīng)熱圖中的藍(lán)色部分)

三、文章中如何應(yīng)用
1做細(xì)胞圖譜(無組別)
比如細(xì)胞有兩個亞型A 和 B,兩者之間存在一個轉(zhuǎn)變關(guān)系,那我們就去做一個擬時序分析,

2、control組的細(xì)胞往case組細(xì)胞特征轉(zhuǎn)變
兩個組別,研究藥物處理或其他處理,導(dǎo)致表達(dá)譜發(fā)生了變化,一種細(xì)胞類型去做擬時序分析,否則無意義
3、某一個細(xì)胞類型下面的重編程或轉(zhuǎn)變軌跡
比如T細(xì)胞的CD4的乃鸚鵡的細(xì)胞往TH的轉(zhuǎn)變
比如CD8的乃鸚鵡T細(xì)胞往CTL毒性方面的轉(zhuǎn)變
或者干細(xì)胞的重編程,人為的特定指定干細(xì)胞往哪個方向轉(zhuǎn)變
這些方面都比較適合做擬時序分析
四、例子文章
1、文章一

首先看以下這個圖

這個圖中都是導(dǎo)管細(xì)胞,做完擬時序分析后,左邊的為正常的導(dǎo)管細(xì)胞,惡化的導(dǎo)管都是右邊的,所以人為的指定左邊的正常導(dǎo)管細(xì)胞為起始點(diǎn),判斷從左往后的腫瘤變化軌跡,然后得到了熱圖

左邊正常,右邊惡化,分為P5和P6兩種模式,P5的基因表達(dá)量都升高,P6的基因先升高后面有點(diǎn)降低

這兩個圖是一個圖
得到了逐漸升高的基因,就可以去做這些基因的功能分析了(可以挑一些基因去做,也可以差異基因去做)
2、文章二
類似于重編程


分為早期、中邊、晚期
最右下角的那個圖是單個基因的動態(tài)變化趨勢,看逐漸升高還是降低,
3、文章三
細(xì)胞圖譜的


A中顏色深的是起始點(diǎn),淺的是終點(diǎn)
為什么下面不是終點(diǎn),上面是終點(diǎn)?因?yàn)樯厦娴木€段長(時間長)


c中表示從start到end的基因的變化趨勢
遇到這種三角的圖(三岔口的擬時序分析)有兩種處理方式

1、直接描繪start---end的變化趨勢,像本文中的c
2、因?yàn)榉种П容^明顯,可以研究這兩者之間的差異


紅黃這兩種變化之間的差異
比如這篇重編程的文章


下面這條是sucessful 代表干細(xì)胞的重編程功能是成功的,得到成功的成纖維,上面那條是重編程失敗的細(xì)胞的變化趨勢,然后繪制熱圖

這種圖是以中間為開始,左邊為失敗的,右邊為成功的,
上面的幾個基因就是在失敗的模式中表達(dá)量很高的,下面的基因在成功的模式中表達(dá)量是很高的