看到了jimmy老師的下述文章,才發(fā)現(xiàn)之前寫的RNAseq實戰(zhàn)還漏了個轉(zhuǎn)錄因子富集分析:
常規(guī)轉(zhuǎn)錄差異建議都加上一個轉(zhuǎn)錄因子數(shù)據(jù) (qq.com)
基因集的轉(zhuǎn)錄因子富集分析 (qq.com)
為什么是AUC值而不是GSEA來挑選轉(zhuǎn)錄因子呢 - 知乎 (zhihu.com)
記一下,之后RNA-seq實戰(zhàn)學(xué)習(xí)一下使用RcisTarget包進(jìn)行轉(zhuǎn)錄因子富集分析,補(bǔ)上這個內(nèi)容
RcisTarget:
Bioconductor:Bioconductor - RcisTarget
使用說明書:RcisTarget: Transcription factor binding motif enrichment (bioconductor.org)
數(shù)據(jù)下載:Index of /cistarget/databases (aertslab.org)
一些中文教程:
常規(guī)轉(zhuǎn)錄差異建議都加上一個轉(zhuǎn)錄因子數(shù)據(jù) (qq.com)
基因集的轉(zhuǎn)錄因子富集分析 (qq.com)
RcisTarget || 從基因列表到調(diào)控網(wǎng)絡(luò) - 簡書 (jianshu.com)
RcisTarget||轉(zhuǎn)錄因子結(jié)合基序富集 - 云+社區(qū) - 騰訊云 (tencent.com)
順便再記一下常用的轉(zhuǎn)錄因子數(shù)據(jù)庫:最強(qiáng)攻略5:史上最全轉(zhuǎn)錄因子數(shù)據(jù)庫匯總解讀 - 知乎 (zhihu.com)
人和小鼠常用TRRUST,這是一個人工注釋的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)數(shù)據(jù)庫,包含轉(zhuǎn)錄因子對應(yīng)的靶基因、轉(zhuǎn)錄因子間調(diào)控關(guān)系,頁面簡潔明了,很不錯:
TRRUST - Transcriptional Regulatory Relationships Unraveled by Sentence-based Text mining (grnpedia.org)
RcisTarget基本介紹
文章:SCENIC: single-cell regulatory network inference and clustering | Nature Methods
RcisTarget是SCENIC方法發(fā)表文章時所用的三大依賴包之一,在SCENIC workflow中的第二步

介紹
Rcis Target可識別基因列表中過表達(dá)(富集)的轉(zhuǎn)錄因子結(jié)合基序 (TFBS)。
在第一步中,Rcis Target 選擇在基因集中基因的轉(zhuǎn)錄起始位點 (TSS) 周圍顯過表達(dá)的 DNA 基序。這是通過使用包含每個基序的全基因組跨物種排名的數(shù)據(jù)庫來實現(xiàn)的。
然后,注釋到 TF 、具有高的標(biāo)準(zhǔn)化富集得分 (NES) 的基序?qū)⒈槐A簟?br>
最后,對于每個基序和基因集,Rcis Target 預(yù)測候選目標(biāo)基因(即基因集中排名位于前沿的基因)

輸入數(shù)據(jù)
Rcis Target的主要輸入是要分析的基因集?;蚣梢宰鳛橐粋€“命名列表”提供,其中每個元素都是一個基因集(包含基因名稱的字符向量)或作為GSEABase:: gene Set。

輸出結(jié)果
Rcis Target 的最終輸出是一個 data.table,其中包含富集基序的信息及其注釋:

