久久精品国产小草,久久久熟妇BBw

現(xiàn)在ChIP-seq的數(shù)據(jù)基本是最常見的測(cè)序數(shù)據(jù)類型之一，主要有Transcription factor ChIP-seq和Histone ChIP-seq。前者是看轉(zhuǎn)錄因子的結(jié)合位置，后者是組蛋白修飾發(fā)生的位置。下面分享一下一般流程。

ChIP-seq

質(zhì)控 (quality control)

首先要看一下ChIP-seq數(shù)據(jù)的質(zhì)量，數(shù)據(jù)的信號(hào)最好比background要強(qiáng)很很多。一般要有control，這樣call peaks更準(zhǔn)確可信， control主要有Input DNA 和 IgG兩種，前一種更常用。

檢測(cè)質(zhì)量的一些方式：
1). peaks中reads的數(shù)量，如果peaks的reads普遍較少，則質(zhì)量一般。
2). peaks信號(hào)高，背景低。
3). 測(cè)序深度深。
4). Diverse library (與重復(fù)duplications有關(guān)，如下圖)

library

4). 有重復(fù)并且與重復(fù)之間相似性較高…
……

做質(zhì)控的軟件方法：
1). ChIPQC (T Carroll, Front Genet, 2014.)
2). SPP package - Unix/Linux (PV Karchenko, Nature Biotechnol, 2008.)
3). ENCODE中的標(biāo)準(zhǔn)流程

序列比對(duì) (mapping of fastq)

序列比對(duì)一般用BWA或者Bowtie2，兩者效果差不多。BWA的bwa samse（單端數(shù)據(jù)）和bwa sampe (雙端數(shù)據(jù)) 跑的速度比較慢，但是效果很不錯(cuò)，用法如下：

bwa index reference.fa   # 建立索引 -p可設(shè)置前綴，不設(shè)置前綴就是reference.fa。

# 單端數(shù)據(jù)
bwa aln -t 8 reference.fa  test.fq.gz > test.sai
bwa samse -n 10 reference.fa  test.sai test.fq.gz > test_se.sam 

# 雙端數(shù)據(jù)：
bwa aln reference.fa test_reads1.fq > test1.sai
bwa aln reference.fa test_reads2.fq > test2.sai
bwa sampe reference.fa test1.sai test2.sai test_reads1.fq test_reads2.fq >  test_pe.sam

BWA的mem，速度很快：

bwa mem reference.fa reads.fq > test_se.sam # 單端
bwa mem reference.fa read1.fq read2.fq > test_pe.sam # 雙端

bowtie2的用法：

bowtie2-build reference.fa index # 創(chuàng)建index

bowtie2  -p 8 -x index -U test_read.fq -S test_se.sam # 單端比對(duì)
bowtie2  -p 8 -x index -1 test_read1.fq -2 test_read2.fq -S test_pe.sam # 雙端比對(duì)

效果個(gè)人感覺(jué)差不多。

去除重復(fù) (remove duplicates)

由于PCR實(shí)驗(yàn)存在不可避免的實(shí)驗(yàn)誤差，所以會(huì)存在重復(fù) (duplicates)。比如兩條不同的reads，起止位置完全一致。比如：

example_dup

其中第二條已經(jīng)被picard標(biāo)注出來(lái)了。被標(biāo)注的第二列flag會(huì)加1024。

去重的軟件中samtools rmdup （基本已不用），samtools markdup（更新后的）和picard最常用。rmdup效果不怎么好，而且如果有遇到相同位置的reads，會(huì)優(yōu)先選擇質(zhì)量高的那一條read。picard與samtools markdup效果相似（仿佛調(diào)用的同一個(gè)？并不確定）。都可以標(biāo)記重復(fù)，也可以選擇直接去掉。以下是用法：

samtools markdup -@ 8 -r test.bam filter_test.bam # -r是直接去掉重復(fù)，不加是直接標(biāo)記

picard去重有三種方式可選，在DUPLICATE_SCORING_STRATEGY參數(shù)中，分別是SUM_OF_BASE_QUALITIES, TOTAL_MAPPED_REFERENCE_LENGTH和RANDOM。即當(dāng)有重復(fù)時(shí)分別選擇留下總堿基質(zhì)量最高的、匹配上參考基因組最長(zhǎng)的和隨機(jī)。

picard MarkDuplicates I=test.bam  O= filter_test.bam M=dup_metrics.txt REMOVE_DUPLICATES=true

在call peak之前需要去除blacklisted regions，這些區(qū)域可能是有問(wèn)題的，詳解及下載可參考http://www.itdecent.cn/p/76edbc772500

#Remove alignments in Encode blacklisted regions : 
intersectBed -v -abam in.bam -b ENCFF001TDO.bed > out.bam

peak calling
peaks是reads信號(hào)比較強(qiáng)的區(qū)域，也就是我們找到的轉(zhuǎn)錄因子或者組蛋白修飾最有可能結(jié)合的地方。call peaks仍然有不少軟件，比較常用的是MACS2和Hotspot2。
示例：

macs2 callpeak -t test.bam -c control.bam -f BAM -g hs -n test -B -q 0.01

針對(duì)不同的數(shù)據(jù)考慮用不同的參數(shù)。

下游分析 (downstream analysis)

分析完之后下游可以做的事情很多，視情況而定?？梢酝瑫r(shí)分析DNase-seq或者ATAC-seq的數(shù)據(jù)，看轉(zhuǎn)錄因子與染色質(zhì)開放區(qū)的關(guān)系；或者Homer等工具注釋peaks，看不同轉(zhuǎn)錄因子/組蛋白修飾之間的關(guān)系，或者分析TF的target gene。也可以用MEME等做motif分析。

歡迎關(guān)注！

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

ChIP-seq分析的一般流程方法

ChIP-seq分析的一般流程方法

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

ChIP-seq分析的一般流程方法

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av