生信分析7:如何利用ATAC-seq數(shù)據(jù)鑒定轉(zhuǎn)錄因子活性

前一篇推送解讀了2022年發(fā)表在DC上的關(guān)于擬南芥再生的文章。文章種利用TOBIAS鑒定了轉(zhuǎn)錄因子的活性。本次推送將介紹這款軟件的原理及使用。

TOBIAS——2020NC

近幾年,用ATAC-seq來(lái)檢測(cè)轉(zhuǎn)錄因子足跡的軟件逐漸完善,2020年發(fā)在NC上的這款軟件——TOBIAS,可以利用ATAC-seq的比對(duì)數(shù)據(jù)bam文件以及基因組的注釋信息去計(jì)算全基因組哪些位置有這種轉(zhuǎn)錄因子足跡。

圖中深藍(lán)色標(biāo)記的這一段就是會(huì)被識(shí)別的轉(zhuǎn)錄因子足跡。如果我們輸入了轉(zhuǎn)錄因子的motif矩陣,該軟件會(huì)幫我們預(yù)測(cè)出這個(gè)位置出現(xiàn)的是哪一種轉(zhuǎn)錄因子。特別是在模式生物擬南芥中,各個(gè)轉(zhuǎn)錄因子被研究的很清楚,所以在擬南芥中的預(yù)測(cè)效果非常好。

軟件安裝

該軟件的依賴較為復(fù)雜,所以建議通過(guò)上述操作在新的環(huán)境中完成配置。

選項(xiàng)介紹

該軟件一共內(nèi)置了10個(gè)子選線以實(shí)現(xiàn)不同的功能。對(duì)于常規(guī)的ATAC-seq數(shù)據(jù)鑒定轉(zhuǎn)錄因子活性只用前三個(gè)選項(xiàng)即可完成。

1-ATACorrect

ATAC-seq測(cè)序中用到的Tn5轉(zhuǎn)座酶具有明顯的的插入偏見(jiàn),這干擾了足跡分析,因此應(yīng)該進(jìn)行校正。ATACorrect選項(xiàng)用來(lái)實(shí)現(xiàn)這種校正。

輸入文件包括該樣本ATAC-seq的bam文件,基因組序列文件、該樣本ATAC-seq 鑒定到的peak的bed文件(可查看往期推送,通過(guò)MACS2完成)。

--cores指定線程數(shù), --outdir指定輸出路徑。

輸出文件的{prefix}_corrected.bw 是校正后的結(jié)果,用于后續(xù)鑒定TF活性。

2-ScoreBigwig

這一步主要用于鑒定轉(zhuǎn)錄因子足跡區(qū)域。

輸入上一步校正后的bw文件,peak的bed文件,輸出鑒定到的轉(zhuǎn)錄因子足跡,注意輸出的是bw文件而非bed文件。

3-BINDetect

根據(jù)上一步得到的轉(zhuǎn)錄因子足跡位點(diǎn),再結(jié)合轉(zhuǎn)錄因子的結(jié)合motif可以得到每一種轉(zhuǎn)錄因子的活性。

轉(zhuǎn)錄因子結(jié)合motif可以從Plant Transcription Factor Database下載,注意最好整合成一個(gè)文件。

輸入文件指定從Plant Transcription Factor Database下載的轉(zhuǎn)錄因子結(jié)合motif的meme文件、第二步得到的轉(zhuǎn)錄因子足跡bw文件、基因組序列文件、test和test2的peak 合并后的bed文件。

作者提到這一步可以應(yīng)用到3種不同的場(chǎng)景:

1、對(duì)單個(gè)條件鑒定TF活性

2、對(duì)兩個(gè)條件鑒定TF活性,可以進(jìn)行差異分析

3、對(duì)時(shí)間序列數(shù)據(jù)鑒定TF活性

具體可參考https://github.com/loosolab/TOBIAS/wiki/BINDetect

主要的輸出文件如圖。<outdir>/bindetect_results.{txt,xlsx}文件提供了每一種TF的得分。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容