【ChIP-seq 實(shí)戰(zhàn)】六、使用macs2找peaks

這里是佳奧!

ChIP-Seq分析進(jìn)入關(guān)鍵步驟。讓我們開始吧!

##合并后的bam以及去除PCR重復(fù)的rmdup.bam
(chipseq) root 21:02:33 /home/kaoku/chipseq/mouse_project/mergeBam
$ ls -lh
總用量 18G
-rw-r--r-- 1 root root  836M  8月 11 15:57 Control.merge.bam
-rw-r--r-- 1 root root  743M  8月 11 20:57 Control.merge.rmdup.bam
-rw-r--r-- 1 root root  1.3G  8月 11 15:58 H2Aub1.merge.bam
-rw-r--r-- 1 root root  1.1G  8月 11 20:58 H2Aub1.merge.rmdup.bam
-rw-r--r-- 1 root root  1.6G  8月 11 15:59 H3K36me3.merge.bam
-rw-r--r-- 1 root root  1.5G  8月 11 20:58 H3K36me3.merge.rmdup.bam
-rw-r--r-- 1 root root  1.3G  8月 11 16:00 Ring1B.merge.bam
-rw-r--r-- 1 root root 1006M  8月 11 20:58 Ring1B.merge.rmdup.bam
-rw-r--r-- 1 root root  1.1G  8月 11 16:01 RNAPII_8WG16.merge.bam
-rw-r--r-- 1 root root  984M  8月 11 20:58 RNAPII_8WG16.merge.rmdup.bam
-rw-r--r-- 1 root root  1.5G  8月 11 16:02 RNAPII_S2P.merge.bam
-rw-r--r-- 1 root root  1.2G  8月 11 20:58 RNAPII_S2P.merge.rmdup.bam
-rw-r--r-- 1 root root  1.4G  8月 11 16:03 RNAPII_S5P.merge.bam
-rw-r--r-- 1 root root  775M  8月 11 20:58 RNAPII_S5P.merge.rmdup.bam
-rw-r--r-- 1 root root  215M  8月 11 16:04 RNAPII_S5PRepeat.merge.bam
-rw-r--r-- 1 root root  210M  8月 11 20:57 RNAPII_S5PRepeat.merge.rmdup.bam
-rw-r--r-- 1 root root  713M  8月 11 16:04 RNAPII_S7P.merge.bam

macs2包含一系列的子命令,其中最主要的就是callpeak, 官方提供了使用實(shí)例

macs2 callpeak -t ChIP.bam -c Control.bam -f BAM -g hs -n test -B -q 0.01

介紹一下各個(gè)參數(shù)的意義:

  • -t: 實(shí)驗(yàn)組的輸出結(jié)果treat
  • -c: 對(duì)照組的輸出結(jié)果control
  • -f: -t和-c提供文件的格式,可以是”ELAND”, “BED”, “ELANDMULTI”, “ELANDEXPORT”, “ELANDMULTIPET” (for pair-end tags), “SAM”, “BAM”, “BOWTIE”, “BAMPE” “BEDPE” 任意一個(gè)。如果不提供這項(xiàng),就是自動(dòng)檢測(cè)選擇。
  • -g: 基因組大小, 默認(rèn)提供了hs, mm, ce, dm選項(xiàng), 不在其中的話,比如說擬南芥,就需要自己提供了。
  • -n: 輸出文件的前綴名
  • -B: 會(huì)保存更多的信息在bedGraph文件中,如fragment pileup, control lambda, -log10pvalue and -log10qvalue scores
  • -q: q值,也就是最小的PDR閾值, 默認(rèn)是0.05。q值是根據(jù)p值利用BH計(jì)算,也就是多重試驗(yàn)矯正后的結(jié)果。
  • -p: 這個(gè)是p值,指定p值后MACS2就不會(huì)用q值了。
  • -m: 和MFOLD有關(guān),而MFOLD和MACS預(yù)構(gòu)建模型有關(guān),默認(rèn)是5:50,MACS會(huì)先尋找100多個(gè)peak區(qū)構(gòu)建模型,一般不用改,因?yàn)槟愫艽蟾怕噬喜粫?huì)懂。

我們實(shí)戰(zhàn)使用的代碼:

cd  ~/mergeBam 

##合并的bam文件運(yùn)行macs2
ls  *merge.bam |cut -d"." -f 1 |while read id;
do 
    if [ ! -s ${id}_summits.bed ];
    then 
echo $id 
macs2 callpeak -c  Control.merge.bam -t $id.merge.bam -f BAM -B -g mm -n $id --outdir ../peaks  2> $id.log &  
    fi 
done  

##把兩邊文件分開避免干擾
mkdir dup
mv *rmdup* dup/
cd dup/

##合并并去除PCR重復(fù)的.rmdup.bam文件運(yùn)行macs2
ls  *.merge.rmdup.bam |cut -d"." -f 1 |while read id;
do 
    if [ ! -s ${id}_rmdup_summits.bed ];
    then 
echo $id 
macs2 callpeak -c  Control.merge.rmdup.bam  -t $id.merge.rmdup.bam  -f BAM -B -g mm -n ${id}_rmdup --outdir ../peaks 2> $id.log &  
    fi 
done  
##查看結(jié)果 合并的bam(運(yùn)行macs2的結(jié)果會(huì)跑到peaks目錄下,這里我改名了,為了分開兩邊的結(jié)果)
(chipseq) root 22:05:35 /home/kaoku/chipseq/mouse_project/peaksMerge
$ ls -lh
總用量 17G
-rw-r--r-- 1 root root 1006M  8月 11 21:53 Control_control_lambda.bdg
-rw-r--r-- 1 root root   77K  8月 11 21:48 Control_model.r
-rw-r--r-- 1 root root     0  8月 11 21:53 Control_peaks.narrowPeak
-rw-r--r-- 1 root root  1013  8月 11 21:53 Control_peaks.xls
-rw-r--r-- 1 root root     0  8月 11 21:53 Control_summits.bed
-rw-r--r-- 1 root root  737M  8月 11 21:53 Control_treat_pileup.bdg
-rw-r--r-- 1 root root  926M  8月 11 21:54 H2Aub1_control_lambda.bdg
-rw-r--r-- 1 root root   77K  8月 11 21:49 H2Aub1_model.r
-rw-r--r-- 1 root root   79K  8月 11 21:54 H2Aub1_peaks.narrowPeak
-rw-r--r-- 1 root root   91K  8月 11 21:54 H2Aub1_peaks.xls
-rw-r--r-- 1 root root   53K  8月 11 21:54 H2Aub1_summits.bed
-rw-r--r-- 1 root root  1.1G  8月 11 21:54 H2Aub1_treat_pileup.bdg
略

##查看比較的統(tǒng)計(jì)信息
$ wc -l *bed
       0 Control_summits.bed
    1115 H2Aub1_summits.bed
   40830 H3K36me3_summits.bed
   26053 Ring1B_summits.bed
   41864 RNAPII_8WG16_summits.bed
   20042 RNAPII_S2P_summits.bed
   38663 RNAPII_S5PRepeat_summits.bed
   62765 RNAPII_S5P_summits.bed
   72640 RNAPII_S7P_summits.bed
  303972 總用量

##查看結(jié)果 合并并去除PCR重復(fù)的bam(peaks目錄是我新建的)
(chipseq) root 22:22:28 /home/kaoku/chipseq/mouse_project/peaks
$ ls -lh
總用量 17G
-rw-r--r-- 1 root root 1006M  8月 11 22:20 Control_rmdup_control_lambda.bdg
-rw-r--r-- 1 root root   77K  8月 11 22:15 Control_rmdup_model.r
-rw-r--r-- 1 root root     0  8月 11 22:20 Control_rmdup_peaks.narrowPeak
-rw-r--r-- 1 root root  1.1K  8月 11 22:20 Control_rmdup_peaks.xls
-rw-r--r-- 1 root root     0  8月 11 22:20 Control_rmdup_summits.bed
-rw-r--r-- 1 root root  737M  8月 11 22:20 Control_rmdup_treat_pileup.bdg
-rw-r--r-- 1 root root  926M  8月 11 22:20 H2Aub1_rmdup_control_lambda.bdg
-rw-r--r-- 1 root root   77K  8月 11 22:16 H2Aub1_rmdup_model.r
-rw-r--r-- 1 root root   86K  8月 11 22:20 H2Aub1_rmdup_peaks.narrowPeak
-rw-r--r-- 1 root root   98K  8月 11 22:20 H2Aub1_rmdup_peaks.xls
-rw-r--r-- 1 root root   59K  8月 11 22:20 H2Aub1_rmdup_summits.bed
-rw-r--r-- 1 root root  1.1G  8月 11 22:20 H2Aub1_rmdup_treat_pileup.bdg
略

##查看比較的統(tǒng)計(jì)信息,去除后結(jié)果略有差別
$ wc -l *bed
       0 Control_rmdup_summits.bed
    1115 H2Aub1_rmdup_summits.bed
   40830 H3K36me3_rmdup_summits.bed
   26053 Ring1B_rmdup_summits.bed
   41841 RNAPII_8WG16_rmdup_summits.bed
   20020 RNAPII_S2P_rmdup_summits.bed
   38663 RNAPII_S5PRepeat_rmdup_summits.bed
   62765 RNAPII_S5P_rmdup_summits.bed
   72577 RNAPII_S7P_rmdup_summits.bed
  303864 總用量

下一步便是可視化操作,我們下一篇再見!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容