HiC數(shù)據(jù)分析之-HiC-Pro

軟件安裝:

主要是編輯系統(tǒng)文件:

PREFIX =/gpfs02/home/jingjing/software/HiC-Pro-master

BOWTIE2_PATH =/gpfs01/software/bio/bowtie2-2.2.4

SAMTOOLS_PATH =/gpfs01/software/bio/samtools-1.7

R_PATH =/gpfs02/software/general/R-3.5.0/bin

PYTHON_PATH = ~/miniconda2/bin/

CLUSTER_SYS = LSF

安裝:

make configure

make install


軟件使用:

其實(shí)思路和以前類似:

比對(duì),過濾,挑選,建立contract map,然后做normalization

優(yōu)點(diǎn):

1. 在處理比對(duì)結(jié)果的時(shí)候加入了并行化,其實(shí)是抄概念,就是分割比對(duì)結(jié)果,多核處理。

2. 在處理reads的時(shí)候,多處理了一部分junction reads的情況。

3. 在存儲(chǔ)最終結(jié)果的時(shí)候采用了sparse 矩陣來降低存儲(chǔ)需求。

4. 多了一個(gè)點(diǎn)就是處理SNP分成父母本的情況。

運(yùn)行:

1. 準(zhǔn)備index文件

bowtie2-build 1.fa,2.fa,...,MT.fahuman_GRCh37

2. 準(zhǔn)備annotation文件

要有兩個(gè):

?第一個(gè)是:HindIII_resfrag_hg19.bed?? 主要通過軟件包里面script

生成

python/gpfs01/software/bio/HiC-Pro-2.11.0/HiC-Pro_2.11.1/bin/utils/digest_genome.py-r hindiii -o HindIII_resfrag_hg19.bed/gpfs02/home/jingjing/software/hicup_v0.7.1/test_dataset/genome/all.fa

第二個(gè)是基因組每個(gè)常染色體長(zhǎng)度文件,chrom_hg19.sizes

這個(gè)主要通過:java compute_lenght_scaffold all.fachrom_hg19.sizes

3. 編輯配置文件



主要需要編輯的地方:

1):index的位置

2):index的名字

3):genome

size文件

4):genome

fragment文件



4. 運(yùn)行HiC-pro


/gpfs01/software/bio/HiC-Pro-2.11.0/HiC-Pro_2.11.1/bin/HiC-Pro-i test_data/ -o HiC-Pro_testop_2.11.1_all -c config_test_latest.txt? 其中參數(shù)i是原始數(shù)據(jù)位置,但是數(shù)據(jù)要分級(jí)存放


運(yùn)行過程中的進(jìn)度都會(huì)顯示。

5. 結(jié)果解讀

1)?? 原始比對(duì)率

trimmed read mapping: 是指把一些本來unaligned的reads去掉一些頭和尾重新比對(duì),這一部分主要面向junction reads



2)reads pair對(duì)之間比對(duì)結(jié)果

這個(gè)主要是看pair的比對(duì)信息。


3) 過濾不合適的interaction pair比例

過濾掉的read pair有:dumpled, self-cycle pair,single end,dangling end....


4) 用的read pair的分布情況

主要分成:cis和trans。cis包含短的和長(zhǎng)的距離。以及距離的分布



5)關(guān)聯(lián)矩陣


HiC-pro默認(rèn)輸出是sparse 矩陣的格式,首先需要一個(gè)bed文件定義chromosome的位置,以及bin的ID:



在matirx中,顯示interaction的強(qiáng)度,前兩個(gè)分別是bin的ID。


iced中存儲(chǔ)normalization之后的結(jié)果。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容