deeptools系列01-multiBamSummary

一、deeptools?multiBamSummary詳細(xì)介紹

官網(wǎng)說明書——deeptools multiBamSummary

功能:計(jì)算兩個(gè)以上(含兩個(gè))BAM文件的基因組區(qū)域的覆蓋度。

兩種模式:

? ? ? ? bin模式是對全基因組進(jìn)行計(jì)算,針對大小相等的bins(默認(rèn)值:10kb),這種模式用于評估BAM文件的全基因組相似性;

? ? ? ? BED-file模式是對指定區(qū)域進(jìn)行計(jì)算。

標(biāo)準(zhǔn)輸出文件:

? ? ? ? 以.npz為后綴的文件,該文件不僅可以直接用于deeptools中的“plotCorrelation”計(jì)算并可視化覆蓋度之間的相關(guān)性,而且也能用于deeptools中的“plotPCA”進(jìn)行主成分分析。



二、deeptools?multiBamSummary用法及參數(shù)

(1)bins mode

multiBamSummary bins --bamfiles file1.bam file2.bam -o results.npz

--bamfiles(-b):bam文件

--outFileName(-out / -o ):? 輸出文件名。

參數(shù):

--labels(-l ) : 非默認(rèn)的標(biāo)簽,用戶自定義文件名標(biāo)簽。標(biāo)簽之間用空格隔開。

--smartLabels: 不用手動給輸入的bam文件加標(biāo)簽,deeptools 會移除路徑和擴(kuò)展名后使用文件名。

--genomeChunkSize : 手動指定基因組大小。默認(rèn)值為不指定,由bam文件的read 密度決定。

--binSize (-bs): 用于樣品的基因組窗口大小。默認(rèn)值是10kb。

--distanceBetweenBins (-n ): 默認(rèn)情況下,multiBamSummary認(rèn)為窗口是連續(xù)的。但是,為了節(jié)省計(jì)算時(shí)間,可以指定比窗口數(shù)更大的間隔長度,服務(wù)器會識別更少的bins.默認(rèn)值是0。

--version: 顯示程序版本號并退出。

--region(-r): 用于限制運(yùn)行的基因組區(qū)域。當(dāng)測試參數(shù)時(shí),利用--region這個(gè)參數(shù)可以大大減少運(yùn)行時(shí)間。格式是:chr:start:end。如 -region chr10 或者 -region chr10:456700:891000。

--blackListFileName(-bl):bed或gtf格式文件能夠包括不用于分析的區(qū)域。通過排除基因組區(qū)塊,能夠產(chǎn)生重疊區(qū)域。對于Bam文件而言,如果一條read有部分黑名單區(qū)域或者片段間隔,那么這個(gè)read或者fragment也仍會被考慮在內(nèi)。如果有相關(guān)情況,注意你應(yīng)該調(diào)整有效的基因組大小。

--numberOfProcessor(-p): 使用處理器的數(shù)量。默認(rèn)值是1。

--verbose(-v): 設(shè)置查看運(yùn)行消息。

--outRawCounts:保存的couts數(shù)區(qū)域(制表符隔開)文件。

--scalingFactors:計(jì)算比例因子(DESeq2 方式)能用于bamCoverage并寫入一個(gè)文件。該文件用制表符隔開樣品列和比例因子列。

--extendReads(-e) : 該參數(shù)可以把reads擴(kuò)展到fragment大小。

--ignoreDuplicates:具有相同起始終止位點(diǎn)的reads僅讀一次。

--minMappingQuality:那些至少達(dá)到最低mapping質(zhì)量得分的reads才能被考慮在內(nèi)。

--centerReads:相對于片段長度,reads處于中心位置。

--samFlagInclude:基于sam flag包括在內(nèi)的reads。默認(rèn)值:None。

--samFlagExclude:基于sam flag之外的reads。默認(rèn)值:None。

--minFragmentLength:最小的片段長度。默認(rèn)值為0。

--maxFragmentLength:最大的片段長度。默認(rèn)值為0。


(2)BED-file mode

multiBamSummary BED-file --BED selection.bed --bamfiles file1.bam file2.bam -o results.npz

參數(shù):

--bamfiles(-b):bam文件,文件之間用空格隔開。

--outFileName(-out/-o): 輸出文件名。

--BED:限制覆蓋度分析的區(qū)域。

--labels(-l ) : 非默認(rèn)的標(biāo)簽,用戶自定義文件名標(biāo)簽。標(biāo)簽之間用空格隔開。

--smartLabels: 不用手動給輸入的bam文件加標(biāo)簽,deeptools 會移除路徑和擴(kuò)展名后使用文件名。

--genomeChunkSize : 手動指定基因組大小。默認(rèn)值為不指定,由bam文件的read 密度決定。

--version: 顯示程序版本號并退出。

--region(-r): 用于限制運(yùn)行的基因組區(qū)域。當(dāng)測試參數(shù)時(shí),利用--region這個(gè)參數(shù)可以大大減少運(yùn)行時(shí)間。格式是:chr:start:end。如 -region chr10 或者 -region chr10:456700:891000。

--blackListFileName(-bl):bed或gtf格式文件能夠包括不用于分析的區(qū)域。通過排除基因組區(qū)塊,能夠產(chǎn)生重疊區(qū)域。對于Bam文件而言,如果一條read有部分黑名單區(qū)域或者片段間隔,那么這個(gè)read或者fragment也仍會被考慮在內(nèi)。如果有相關(guān)情況,注意你應(yīng)該調(diào)整有效的基因組大小。

--numberOfProcessor(-p): 使用處理器的數(shù)量。默認(rèn)值是1。

--verbose(-v): 設(shè)置查看運(yùn)行消息。

--outRawCounts:保存的couts數(shù)區(qū)域(制表符隔開)文件。

--scalingFactors:計(jì)算比例因子(DESeq2 方式)能用于bamCoverage并寫入一個(gè)文件。該文件用制表符隔開樣品列和比例因子列。

--extendReads(-e) : 該參數(shù)可以把reads擴(kuò)展到fragment大小。

--ignoreDuplicates:具有相同起始終止位點(diǎn)的reads僅讀一次。

--minMappingQuality:那些至少達(dá)到最低mapping質(zhì)量得分的reads才能被考慮在內(nèi)。

--centerReads:相對于片段長度,reads處于中心位置。

--samFlagInclude:基于sam flag包括在內(nèi)的reads。默認(rèn)值:None。

--samFlagExclude:基于sam flag之外的reads。默認(rèn)值:None。

--minFragmentLength:最小的片段長度。默認(rèn)值為0。

--maxFragmentLength:最大的片段長度。默認(rèn)值為0。

GTF/BED12 參數(shù):

--metagene : 當(dāng)BED12或GTF文件用于提供區(qū)域,會計(jì)算合并的外顯子,而不是用5'端或3'端來定義間隔。默認(rèn)值是False。

--transcriptID: 當(dāng)GTF文件用于提供區(qū)域,第三列transcript用于計(jì)算。默認(rèn)值是transcript。

--exonID: 當(dāng)GTF文件用于提供區(qū)域,第三列exon用于計(jì)算。默認(rèn)值是exon。

--transcript_id_designator: 默認(rèn)值是transcript_id。


三、deeptools?multiBamSummary實(shí)際操作

multiBamSummary bins --bamfiles x.bam y.bam --binSize=500 -p 20 --smartLabels -out readCounts.npz --outRawCounts readCounts.tab

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • deepTools 是一套基于python開發(fā)的工具,適用于有效處理分析高通量測序數(shù)據(jù),可用于ChIP-seq, ...
    JeremyL閱讀 65,712評論 9 73
  • 1. 環(huán)境配置 2. 數(shù)據(jù)下載 (1)prefetch下載 首先找到要下載的數(shù)據(jù)(SRR...號)創(chuàng)建projec...
    陳小云的筆記本閱讀 10,815評論 2 53
  • 全文分析流程學(xué)習(xí)按照:九月學(xué)徒ChIP-seq學(xué)習(xí)成果展 一、 怎么將SAR文件轉(zhuǎn)為fastq文件? 1. 【方...
    Htt_1996閱讀 4,084評論 1 9
  • 上次我們整理到bwa比對后得到bam文件,下一步我們要通過GATK流程從bam文件中call variant。 一...
    商乙農(nóng)林科技閱讀 2,202評論 0 4
  • 翻譯DMRfinder官方說明文檔。 Introduction DMRfinder 是一款用于WGBS的C位點(diǎn)提取...
    黃晶_id閱讀 11,286評論 6 23

友情鏈接更多精彩內(nèi)容