ChIP-Seq分析流程記錄

ChIP-seq簡(jiǎn)介

概念: ChIP-Seq是用于在全基因組范圍中研究DNA結(jié)合蛋白(相互反應(yīng))、組蛋白修飾(表觀遺傳標(biāo)記)和核小體的技術(shù),研究這三個(gè)主題可有助于了解基因之間的相互調(diào)控以及染色體的功能結(jié)構(gòu)。

ChIP-Seq實(shí)驗(yàn)原理: 在生理狀態(tài)下,把細(xì)胞內(nèi)的DNA與蛋白質(zhì)交聯(lián)(Crosslink)后裂解細(xì)胞,分離染色體,通過(guò)超聲或酶處理將染色質(zhì)隨機(jī)切割,利用抗原抗體的特異性識(shí)別反應(yīng),將與目的蛋白相結(jié)合的DNA片段沉淀下來(lái),再通過(guò)反交聯(lián)(Reverse crosslink)釋放結(jié)合蛋白的DNA片段,最后測(cè)序獲得DNA片段的序列。

注意:當(dāng)研究重點(diǎn)是得到核小體的位置和組蛋白修飾的位置的時(shí)候,實(shí)驗(yàn)中并不首先進(jìn)行crosslink,而是用超聲或者M(jìn)Nase直接進(jìn)行打斷,優(yōu)先使用MNase,可以更高效地去除掉linker DNA片段以得到核小體更為精確的位置。

空白對(duì)照::空白對(duì)照是必要的,存在很多假陽(yáng)性情況,舉例:1. 開(kāi)放的染色體區(qū)域更容易被打斷成片段,這樣導(dǎo)致tag數(shù)在基因組上的分布是不均勻的;2.很多重復(fù)序列會(huì)使做map的時(shí)候得到結(jié)果難以解釋。空白對(duì)照的用途:可以判斷由ChIP-Seq得到的peak時(shí)候具有統(tǒng)計(jì)上的顯著性。

三種類(lèi)型的空白對(duì)照:1.部分進(jìn)行免疫共沉淀前的DNA(input DNA),這是最常用的;2.由免疫共沉淀得到而不含有抗體的DNA(mock IP DNA),使用這個(gè)的一個(gè)問(wèn)題是收集到的量可能不夠;3.使用非特異免疫共沉淀方法得到的DNA.

SRA數(shù)據(jù)下載

以擬南芥轉(zhuǎn)錄因子AP1為例(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE46986), 下載對(duì)應(yīng)的ChIP-seq(SRR851698)和Control(SRR851703)數(shù)據(jù)

axel -n 20 ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR851/SRR851703/SRR851703.sra
axel -n 20 ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR851/SRR851698/SRR851698.sra

SRA轉(zhuǎn)換為FASTQ

# 參數(shù)--split-3可自動(dòng)識(shí)別單端還是雙端數(shù)據(jù)
fastq-dump --split-3 SRR851703.sra
fastq-dump --split-3 SRR851698.sra

Trimmomatic過(guò)濾低質(zhì)量的reads

# 該示例數(shù)據(jù)未單端
java -jar trimmomatic-0.36.jar SE -phred33 SRR851703.fastq SRR851703_filtered.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36
java -jar trimmomatic-0.36.jar SE -phred33 SRR851698.fastq SRR851698_filtered.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36
# 對(duì)于雙端數(shù)據(jù)集
java -jar trimmomatic-0.36.jar PE -phred33 input_1.fastq input_2.fastq input_1_paired.fq input_1_unpaired.fq input_2_paired.fq input_2_unpaired.fq LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36

除此之外,Trimmomatic還包含illumina測(cè)序平臺(tái)的常用接頭,因此也可以用于去接頭

# 單端
java -jar trimmomatic-0.36.jar SE -phred33 SRR851703.fastq SRR851703_filtered.fastq ILLUMINACLIP:~/Trimmomatic-0.36/adapters/TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36
# 雙端
java -jar trimmomatic-0.36.jar PE -phred33 input_1.fastq input_2.fastq input_1_paired.fq input_1_unpaired.fq input_2_paired.fq input_2_unpaired.fq ILLUMINACLIP:~/Trimmomatic-0.36/adapters/TruSeq3-PE.fa:2:30:10  LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36

注意:~/Trimmomatic-0.36/adapters/TruSeq3-PE.fa 應(yīng)為絕對(duì)路徑

比對(duì)到參考基因組

擬南芥(Arabidopsis thaliana)參考基因組下載
wget ftp://ftp.ensemblgenomes.org/pub/plants/release-40/fasta/arabidopsis_thaliana/dna/Arabidopsis_thaliana.TAIR10.dna_sm.toplevel.fa.gz
gunzip Arabidopsis_thaliana.TAIR10.dna_sm.toplevel.fa.gz
mv Arabidopsis_thaliana.TAIR10.dna_sm.toplevel.fa arabidopsis_genome.fa
Bowtie比對(duì)
為基因組序列創(chuàng)建index
bowtie-build arabidopsis_genome.fa
使用默認(rèn)參數(shù)比對(duì)
# alignment
bowtie arabidopsis_genome.fa SRR851703_filtered.fastq -S SRR851703.sam
bowtie arabidopsis_genome.fa SRR851698_filtered.fastq -S SRR851698.sam
# Conver to bam
samtools view -bS SRR851703.sam > SRR851703.bam
samtools view -bS SRR851698.sam > SRR851698.bam
# sort
samtools sort -o SRR851703.sort.bam SRR851703.bam
samtools sort -o SRR851698.sort.bam SRR851698.bam
# Creat index
samtools index SRR851703.sort.bam
samtools index SRR851698.sort.bam
# Extract uniquely mapped reads
samtools view -h -q 255 SRR851703.sort.bam | samtools view -bhS - > SRR851703_unique_mapped.bam
samtools view -h -q 255 SRR851698.sort.bam | samtools view -bhS - > SRR851698_unique_mapped.bam

MACS2 peak calling

macs2 callpeak -t SRR851698_unique_mapped.bam -c SRR851703_unique_mapped.bam -f BAM -g 1.35e8 -n AP1 -q 0.05
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容