關(guān)于macs2

1. macs2 bdgcmp的用法

macs2 bdgcmp是用來比較和處理兩個(gè)由MACS2生成的bedGraph文件的。它的主要用途是從兩個(gè)比較的樣本中生成一個(gè)對(duì)數(shù)比率文件(logLR文件)或者差分文件。

以下是使用macs2 bdgcmp的基本語法:

macs2 bdgcmp -t treatment_file -c control_file -o output_file -m method

在這個(gè)命令中:

-t后面跟的是處理組的bedGraph文件。
-c后面跟的是對(duì)照組的bedGraph文件。
-o后面跟的是輸出文件的名字。
-m后面跟的是你想使用的計(jì)算方法,可以是ppois(兩個(gè)泊松分布的比率),subtract(直接相減),logFE(對(duì)數(shù)尺度的疊加比),logLR(對(duì)數(shù)似然比),log2LR(對(duì)數(shù)尺度的似然比)。
例如,如果你想用對(duì)數(shù)似然比方法比較treat.bdg和control.bdg文件,你可以使用以下命令:

macs2 bdgcmp -t treat.bdg -c control.bdg -o treat_vs_control.bdg -m logLR

這個(gè)命令會(huì)生成一個(gè)名為treat_vs_control.bdg的文件,其中包含了對(duì)數(shù)似然比。

請(qǐng)注意,所有的命令和選項(xiàng)都應(yīng)當(dāng)根據(jù)你的實(shí)際需要和數(shù)據(jù)來選擇和調(diào)整。在使用macs2 bdgcmp之前,你可能需要先使用macs2 callpeak來生成peak調(diào)用結(jié)果,然后使用macs2 bdgpeakcall或者其他方法來生成bedGraph文件。

2. macs2 callpeak命令

可以生成多種類型的輸出文件,包括:

_peaks.xls:包含了所有peaks的詳細(xì)列表。
_peaks.narrowPeak:BED格式的文件,包含了所有的peaks。
_summits.bed:包含了所有peaks的頂峰位置的BED文件。
另外,你可以用-B和--SPMR選項(xiàng)讓MACS2生成bedGraph文件,這個(gè)文件中包含了每個(gè)基因組位置的覆蓋度或者"信號(hào)強(qiáng)度":

macs2 callpeak -t treatment.bam -c control.bam -f BAM -g hs -n sample -B --SPMR

在這個(gè)命令中:

-t后面跟的是處理組的BAM文件。
-c后面跟的是對(duì)照組的BAM文件。
-f BAM說明輸入文件是BAM格式的。
-g hs指定基因組大小為human。
-n后面跟的是輸出文件的前綴。
-B告訴MACS2生成bedGraph文件。
--SPMR讓MACS2將bedGraph文件中的讀數(shù)轉(zhuǎn)化為每百萬reads的比率。
這樣生成的_treat_pileup.bdg文件就包含了處理組的定量信號(hào),其中每個(gè)位置的值代表了那個(gè)位置的reads覆蓋度,已經(jīng)被標(biāo)準(zhǔn)化為每百萬reads的比率。

然而,需要注意的是這個(gè)"信號(hào)強(qiáng)度"并不是-logP值。-logP值通常用于表示某個(gè)事件的統(tǒng)計(jì)顯著性,比如某個(gè)位置是一個(gè)顯著的peak的概率。
在MACS2的peak calling結(jié)果中,_peaks.xls和_peaks.narrowPeak文件中包含了每個(gè)peak的-log10(qvalue),這個(gè)qvalue是經(jīng)過多重檢驗(yàn)修正的p值,可以用于評(píng)估每個(gè)peak的顯著性。

3 take home message

_peaks.narrowPeak文件是MACS2的peak calling結(jié)果,每一行代表一個(gè)peak。每個(gè)peak包含了染色體位置(起始位置和結(jié)束位置)、名稱、p值、q值等信息。在這個(gè)文件中,只有被識(shí)別為peaks的基因組區(qū)域有對(duì)應(yīng)的行,其他非peak區(qū)域并沒有記錄在文件中。

_treat_pileup.bdg文件是MACS2生成的覆蓋度文件,每一行代表一個(gè)基因組區(qū)域(通常為固定的窗口大小,如1bp)。在這個(gè)文件中,每個(gè)位置(或窗口)的值代表了這個(gè)位置的reads覆蓋度(或標(biāo)準(zhǔn)化后的覆蓋度,如果使用了--SPMR選項(xiàng))。

因此,_peaks.narrowPeak文件和_treat_pileup.bdg文件提供了不同的信息:

_peaks.narrowPeak文件提供了每個(gè)peak的顯著性(p值或q值),可以用來鑒別哪些位置是蛋白質(zhì)-DNA結(jié)合的顯著位置。
_treat_pileup.bdg文件提供了每個(gè)位置的reads覆蓋度,可以用來評(píng)估每個(gè)位置的信號(hào)強(qiáng)度或者reads豐度。
將_peaks.narrowPeak文件轉(zhuǎn)換為bedGraph格式,只能得到peak位置的-log10(pvalue)或-log10(qvalue)。非peak區(qū)域并沒有記錄在文件中,或者需要被設(shè)置為0或其他默認(rèn)值。

將_treat_pileup.bdg文件轉(zhuǎn)換為bigwig格式,可以得到整個(gè)基因組每個(gè)位置的reads覆蓋度,包括peak區(qū)域和非peak區(qū)域。

因此,如果你希望得到每個(gè)peak的顯著性,你應(yīng)該使用_peaks.narrowPeak文件。如果你希望得到每個(gè)位置的reads覆蓋度,你應(yīng)該使用_treat_pileup.bdg文件。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容