各種HIC處理數(shù)據(jù)之間的相互轉(zhuǎn)化

各種HIC處理數(shù)據(jù)之間的相互轉(zhuǎn)化


目前HI-C數(shù)據(jù)研究比較火爆,出現(xiàn)了各種各樣的工具來分析HI-C。這些工具各有優(yōu)缺點(diǎn),而且對應(yīng)的有不同的下游處理工具。但這些工具的結(jié)果數(shù)據(jù)格式大相徑庭。如 juicer的.hic,hic-pro的六列文件,cool,hdf5,homer等。這些文件格式的不同給數(shù)據(jù)處理也帶來了一定的困難。之前我已經(jīng)介紹過

Hic-pro的結(jié)果文件轉(zhuǎn)化為.hic文件,在juicebox中實(shí)現(xiàn)可視化,今天我就拓展下數(shù)據(jù)轉(zhuǎn)化的范圍。

今天我們用到的是HiCExplorer

1,安裝HiCExplorer


conda install hicexplorer -c bioconda -c conda-forge

這個(gè)是官網(wǎng)寫的,但我試了幾次,都用不了。所以只好從bioconda 重新搜了下載

image-20210125155743530

從三個(gè)下載命令中,隨便選擇一個(gè)就好。

2,進(jìn)行轉(zhuǎn)化


hicexplorer里面工具很多,有興趣可以詳細(xì)看一下https://hicexplorer.readthedocs.io/en/latest/content/tools/hicConvertFormat.html

轉(zhuǎn)化使用的工具是它里面的hicConvertFormat

image-20210125160659399

必須的幾個(gè)參數(shù)是:

image-20210125160748677

-m 你需要進(jìn)行轉(zhuǎn)化的文件

-o 轉(zhuǎn)化后輸出的文件

--inputFormat 輸入文件格式,就是這幾種{H5,cool,hic,homer,hicpro}

--outputFormat 輸出文件格式 {cool,h5,homer,ginteractions,mcool}

3,例子


hic to cool
 hicConvertFormat -m matrix.hic --inputFormat hic --outputFormat cool -o matrix.cool --resolutions 10000

--resolutions 分辨率,其中一個(gè)[2500000, 1000000, 500000, 250000, 100000, 50000, 25000, 10000, 5000]

cool to cool
hicConvertFormat -m matrix.cool --inputFormat cool --outputFormat cool -o matrix.cool --correction_name KR
homer to cool
hicConvertFormat -m matrix.homer --inputFormat homer --outputFormat cool -o matrix.cool
hicpro to cool
hicConvertFormat -m matrix.hicpro --bedFileHicpro hicpro.bed --inputFormat hicpro --outputFormat cool -o matrix.cool

這些命令都很簡單。值得注意的是 .hic只能先轉(zhuǎn)化為.cool文件,然后借助cool文件才能轉(zhuǎn)化為其它類型

cool to h5
hicConvertFormat -m matric_5000.cool --inputFormat cool --outputFormat h5 -o matric.h5 --resolutions 5000
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容