ChIP-seq(三)MACS2 peak calling

MACS2(Model-based Analysis of ChIP-seq)
usage:

macs2 callpeak -t TFILE -c CFILE -g GSIZE  -n NAME

-t:--treatment file;
-c:Control file;
-f:--format {AUTO,BAM,SAM,BED...},默認(rèn)為AUTO;
-g:GSIZE,Effective genome size,'hs' for human (2.7e9),也就是2.7G;'mm' for mouse (1.87e9);
-n:output NAME,Experiment name, which will be used to generate output file names. DEFAULT: "NA";
正式開始啦~

vim macs2.sh
#!/bin/bash
for i in 807 809 810 811 812 813 
do
  macs2 callpeak -t SRR13764${i}.bam -c SRR13764817.bam -g hs -n SRR13764${i}_macs2 --outdir ~/chipseq/fastq/clean_data/macs2
done
#提交
qsub -N macs -cwd macs2.sh -q g5.q

生成4種格式的文件:
\diamondNAME_peaks.xls: 以表格形式存放peak信息,是1-based;
abs_summit:代表峰值; pileup:代表peak 峰值的高度(pileup height at peak summit);-log10(pvalue) :pvalue of the peak summit;fold_enrichment:peak的富集倍數(shù);-log10(qvalue):衡量錯(cuò)誤發(fā)現(xiàn)率的指標(biāo)(FDR,F(xiàn)alse discovery rate,所有檢驗(yàn)中假陽性的概率);
\diamondNAME_peaks.narrowPeak:Bed6 format(bed格式中的前六列),是0-based,NAME_peaks.xls坐標(biāo)-1是NAME_peaks.narrowPeak坐標(biāo);
\diamondNAME_summits.bed:記錄每個(gè)peak的summits峰值;
\diamondNAME_model.r:能通過$ Rscript NAME_model.r作圖,得到基于提供數(shù)據(jù)的peak模型。
參考:如何使用MACS進(jìn)行peak calling - 簡(jiǎn)書 (jianshu.com)
1-based 對(duì)應(yīng)堿基的位置 ( base-counted ),0-based 對(duì)應(yīng)兩個(gè)堿基之間的位置 ( space-counted )。參考0-based or 1-based? 詳解常見生信格式的染色體坐標(biāo)系統(tǒng) - 知乎 (zhihu.com)

narrowpeak file 轉(zhuǎn)換為 FASTA

上傳本地macs2分析的narrowpeak file到Galaxy,利用 Galaxy workflow從SRR13764813_macs2_summits.bed文件提取fasta文件 。
其中peak左右延伸250bp,central 100 bp 用于 de novo motif discovery, the flanking 400 bp作為negative control。
下載workflow
Search for Downloadable ENCODE Files in the Human Feb. 2009 (GRCh37/hg19) Assembly (ucsc.edu)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容