軟件安裝:
主要是編輯系統(tǒng)文件:
PREFIX =/gpfs02/home/jingjing/software/HiC-Pro-master
BOWTIE2_PATH =/gpfs01/software/bio/bowtie2-2.2.4
SAMTOOLS_PATH =/gpfs01/software/bio/samtools-1.7
R_PATH =/gpfs02/software/general/R-3.5.0/bin
PYTHON_PATH = ~/miniconda2/bin/
CLUSTER_SYS = LSF
安裝:
make configure
make install
軟件使用:

其實(shí)思路和以前類似:
比對(duì),過濾,挑選,建立contract map,然后做normalization
優(yōu)點(diǎn):
1. 在處理比對(duì)結(jié)果的時(shí)候加入了并行化,其實(shí)是抄概念,就是分割比對(duì)結(jié)果,多核處理。
2. 在處理reads的時(shí)候,多處理了一部分junction reads的情況。
3. 在存儲(chǔ)最終結(jié)果的時(shí)候采用了sparse 矩陣來降低存儲(chǔ)需求。
4. 多了一個(gè)點(diǎn)就是處理SNP分成父母本的情況。
運(yùn)行:
1. 準(zhǔn)備index文件
bowtie2-build 1.fa,2.fa,...,MT.fahuman_GRCh37
2. 準(zhǔn)備annotation文件
要有兩個(gè):
?第一個(gè)是:HindIII_resfrag_hg19.bed?? 主要通過軟件包里面script
生成
python/gpfs01/software/bio/HiC-Pro-2.11.0/HiC-Pro_2.11.1/bin/utils/digest_genome.py-r hindiii -o HindIII_resfrag_hg19.bed/gpfs02/home/jingjing/software/hicup_v0.7.1/test_dataset/genome/all.fa
第二個(gè)是基因組每個(gè)常染色體長(zhǎng)度文件,chrom_hg19.sizes
這個(gè)主要通過:java compute_lenght_scaffold all.fachrom_hg19.sizes

3. 編輯配置文件


主要需要編輯的地方:
1):index的位置
2):index的名字
3):genome
size文件
4):genome
fragment文件
4. 運(yùn)行HiC-pro
/gpfs01/software/bio/HiC-Pro-2.11.0/HiC-Pro_2.11.1/bin/HiC-Pro-i test_data/ -o HiC-Pro_testop_2.11.1_all -c config_test_latest.txt? 其中參數(shù)i是原始數(shù)據(jù)位置,但是數(shù)據(jù)要分級(jí)存放

運(yùn)行過程中的進(jìn)度都會(huì)顯示。
5. 結(jié)果解讀
1)?? 原始比對(duì)率
trimmed read mapping: 是指把一些本來unaligned的reads去掉一些頭和尾重新比對(duì),這一部分主要面向junction reads

2)reads pair對(duì)之間比對(duì)結(jié)果
這個(gè)主要是看pair的比對(duì)信息。

3) 過濾不合適的interaction pair比例
過濾掉的read pair有:dumpled, self-cycle pair,single end,dangling end....

4) 用的read pair的分布情況
主要分成:cis和trans。cis包含短的和長(zhǎng)的距離。以及距離的分布


5)關(guān)聯(lián)矩陣
HiC-pro默認(rèn)輸出是sparse 矩陣的格式,首先需要一個(gè)bed文件定義chromosome的位置,以及bin的ID:

在matirx中,顯示interaction的強(qiáng)度,前兩個(gè)分別是bin的ID。

iced中存儲(chǔ)normalization之后的結(jié)果。