1. 簡介

SCENIC （single-cell regulatory network inference and clustering）是一個基于共表達和motif分析，計算單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)基因調(diào)控網(wǎng)絡(luò)重建以及細(xì)胞狀態(tài)鑒定的方法。

2017年發(fā)表在Nature Methods雜志上的SCENIC算法，利用單細(xì)胞RNA-seq數(shù)據(jù)，同時進行基因調(diào)控網(wǎng)絡(luò)重建和細(xì)胞狀態(tài)鑒定，應(yīng)用于腫瘤和小鼠大腦單細(xì)胞圖譜數(shù)據(jù)，提出并證明了順式調(diào)控網(wǎng)絡(luò)分析能夠用于指導(dǎo)轉(zhuǎn)錄因子和細(xì)胞狀態(tài)的鑒定。

SCENIC通過使用生物學(xué)驅(qū)動的features自動清除腫瘤樣本特異性等批次效應(yīng)。

有一些文章寫的挺好的，在這里匯總一下：

https://www.cnblogs.com/raisok/p/12425225.html

http://www.itdecent.cn/p/cd967c449177

https://cloud.tencent.com/developer/article/1692240

2. 原理

GRN（gene regulatory network）基因調(diào)控網(wǎng)絡(luò)包括TF（transcription factor轉(zhuǎn)錄因子）、cofactor（共調(diào)因子）與其調(diào)節(jié)的target gene 組成，決定了某個狀態(tài)下的細(xì)胞的轉(zhuǎn)錄狀態(tài)。SCENIC流程包括三步驟：

（1）使用GENIE3或GRNBoost (Gradient Boosting) 基于共表達推斷轉(zhuǎn)錄因子與候選靶基因之間的共表達模塊。

（2）由于GENIE3模型只是基于共表達，會存在很多假陽性和間接靶標(biāo)，為了識別直接結(jié)合靶標(biāo)（direct-binding targets），使用RcisTarget對每個共表達模塊進行順式調(diào)控基序（cis-regulatory motif）分析。進行TF-motif富集分析，識別直接靶標(biāo)。（僅保留具有正確的上游調(diào)節(jié)子且顯著富集的motif modules，并對它們進行修剪以除去缺乏motif支持的間接靶標(biāo)。）這些處理后的每個TF及其潛在的直接targets gene被稱作一個調(diào)節(jié)子（regulon）；

（3）使用AUCell算法對每個細(xì)胞的每個regulon活性進行打分。對于一個regulon來說，比較細(xì)胞間的AUCell 得分可以鑒定出哪種細(xì)胞有顯著更高的subnetwork活性。結(jié)果生成一個二進制的regulon活性矩陣（binarized activity matrix），這將確定Regulon在哪些細(xì)胞中處于“打開”狀態(tài)。

image.png

補充：

蛋白質(zhì)中功能的基本單元是domain,是一種特殊的三維結(jié)構(gòu)，不同結(jié)構(gòu)的domain與其他分子特異性結(jié)合從而發(fā)揮功能。與此類似，轉(zhuǎn)錄因子在于DNA序列結(jié)合時，其結(jié)合位點的序列也由于一定的特異性，不同轉(zhuǎn)錄因子結(jié)合的DNA序列的模式是不同的。為了更好的描述結(jié)合位點序列的模式，科學(xué)家們提出了motif的概念。

2.1 GENIE3

GENIE3是一種從基因表達量數(shù)據(jù)推斷基因調(diào)控網(wǎng)絡(luò)的方法。它訓(xùn)練預(yù)測數(shù)據(jù)集中每個基因表達的隨機森林模型，并使用TF的表達作為輸入。然后使用不同的模型來得出TF的權(quán)重，并測量它們各自的相關(guān)性以預(yù)測每個靶基因的表達。

GENIE3的輸入為表達矩陣，最好使用gene-summarized counts（可能是也可能不是UMIs）。其他單位，比如counts，TPM和FPKM/RPKM也可以。但是要注意第一步的網(wǎng)絡(luò)相關(guān)分析基于共表達，一些作者建議也可以使用within-sample normalization比如TPM。

GENIE3的輸出是一個帶有基因、潛在調(diào)節(jié)因子以及IM（importance measure）的表。IM代表了TF（input gene）在預(yù)測靶標(biāo)時的權(quán)重。作者探索了幾種確定閾值的方法，最終選擇為每個TF建立多個潛在靶標(biāo)基因集：（1）設(shè)置幾個IM閾值（IM>0.001 and IM >0.005)

（2）選取每個TF的前50哥靶標(biāo)targets

（3）每個target gene保留top5，10，50個TFs，然后按TF分開。

在以上結(jié)果中，只有IM>0.001的links被算入。

每個基因集接著被分為positive- and negetive-correlated targets來區(qū)分可能激活的和抑制的targets。（TF和潛在靶標(biāo)的Spearman相關(guān)性計算）

最終，只有包含30個基因以上的基因集（TF共表達模型）被保留，用于下游分析。

2.2 RcisTarget

RcisTarget是i-cisTarget和iRegulon的motif富集框架的新R / Bioconductor實現(xiàn)。

RcisTarget從一個基因列表識別富集的TF-binding motifs和候選轉(zhuǎn)錄因子。主要有兩步驟：

（1）選擇在基因集中基因TSS（transcription start site）附近顯著過表達的DNA motif。這一步通過在數(shù)據(jù)庫中應(yīng)用recovery-based method（基于恢復(fù)的方法）來實現(xiàn)的，該數(shù)據(jù)庫包含每個motif的全基因組跨物種排名。保留注釋到對應(yīng)TF并且NES（normalized enrichment score）>3的motif。

（2）對于每一個motif和基因集，RcisTarget預(yù)測候選靶標(biāo)基因，也就是基因集中排名領(lǐng)先的基因。這一步提供的結(jié)果跟i-cisTarget和iiRegulon相同。

為了構(gòu)建最終的regulon，作者合并了每個TF module中預(yù)測的靶基因，這些基因顯示了給定TF的任何motif的富集。但是在作者分析的數(shù)據(jù)中，這些modules數(shù)量很少而且motif富集很低。因此，最終決定從流程中去除對于直接表達的檢測，只使用positive-correlated targets進行下游分析。

2.3 AUCell

對于一個給定的regulon，通過比較所有細(xì)胞間的AUCell（area under the recovery curve）打分值，我們可以識別哪些細(xì)胞具有更顯著高的regulon活性。

輸入為一個基因集，輸出為基因集每個細(xì)胞的‘a(chǎn)ctivity’。這些基因集即regulon，包含TFs和他們假定的的target?；趓ecovery analysis將根據(jù)表達水平將所有基因進行排序。AUC代表了與細(xì)胞內(nèi)其他基因相比，特征基因中表達基因的比例及其相對表達值。AUCell使用AUC來計算輸入基因集的關(guān)鍵子集是否在每個細(xì)胞的排名頂部都得到了富集。將輸出一個每個基因集在每個細(xì)胞的AUC score矩陣。

通過卡閾值得到的二元活性矩陣使矩陣維數(shù)減少（可理解為只有 0|1，on|off），對于下游分析很有用。例如，基于regulon二元活性矩陣的聚類，可以根據(jù)某個調(diào)控子網(wǎng)絡(luò)（regulon）的活性來識別細(xì)胞群類型和細(xì)胞狀態(tài)。由于regulon是整體評分的，而不是使用單個基因的表達，因此這種方法對于個別基因的dropouts很有效。
參考：https://g.yuque.com/u103816/kvy887/eukoou

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

SCENIC單細(xì)胞轉(zhuǎn)錄因子分析原理

SCENIC單細(xì)胞轉(zhuǎn)錄因子分析原理

1. 簡介

2. 原理

2.1 GENIE3

2.2 RcisTarget

2.3 AUCell

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

SCENIC單細(xì)胞轉(zhuǎn)錄因子分析原理

1. 簡介

2. 原理

2.1 GENIE3

2.2 RcisTarget

2.3 AUCell

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av