HiC-Pro的Singularity簡明使用指南

關(guān)于原理部分和更詳細(xì)的介紹,見HiC-Pro: Hi-C數(shù)據(jù)預(yù)處理高效工具, 這里只介紹如何快速使用Singularity的HiC-Pro進(jìn)行數(shù)據(jù)分析。

關(guān)鍵內(nèi)容就是,config-hicpro.txt 里的文件路徑信息都必須是絕對(duì)路徑,否則默認(rèn)都位于annotation目錄下。切記,切記,切記。

第零步: Singularity的HiC-Pro鏡像下載,

# 下載
mkdir -p /opt/biosoft/HiC-Pro 
cd /opt/biosoft/HiC-Pro 
wget https://zerkalo.curie.fr/partage/HiC-Pro/singularity_images/hicpro_latest_ubuntu.img
# 使用
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -h

第一步:建立輸入數(shù)據(jù)文件夾, 數(shù)據(jù)不能是軟連接形式,只能是復(fù)制或者移動(dòng)

mkdir -p fastq/xxx
cp xxx_R1.fastq.gz xxx_R2.fastq.gz  fastq/xxx/
# 如果有多個(gè)樣本
mkdir -p fastq/yyy
cp yyy_R1.fastq.gz yyy_R2.fastq.gz  fastq/yyy/

第二步:創(chuàng)建參考數(shù)據(jù)庫,需要修改ENZYME

ENZYME=DpnII
# build reference
mkdir reference
mv 你的參考序列.fasta  reference/genome.fa
# enzyme site
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
    /usr/local/bin/HiC-Pro_2.11.4/bin/utils/digest_genome.py -r $ENZYME \
    -o reference/genome_${ENZYME}.bed reference/genome.fa
# genome size
seqkit fx2tab -nl reference/genome.fa | awk '{print $1"\t"$2}' > reference/genome.chrom.size
# bowtie/2.3.4.3
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
    bowtie2-build --threads 60 reference/genome.fa reference/genome  

第三步: 復(fù)制配置文件并修改

# config
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
  cp /usr/local/bin/HiC-Pro_2.11.4/config-hicpro.txt  config-hicpro.txt

修改其中的如下項(xiàng),

  • N_CPU=80 線程數(shù)
  • BOWTIE2_IDX_PATH: 必須是絕對(duì)路徑,例如 /home/xzg/reference
  • REFERENCE_GENOME=genome
  • GENOME_SIZE=必須是絕對(duì)路徑, 例如/home/xzg/reference/genome.chrom.size
  • GENOME_FRAGMENT= 必須是絕對(duì)路徑 例如/home/xzg/reference/genome_DpnII.bed
  • LIGATION_SITE=根據(jù)實(shí)際酶切位點(diǎn)來, 例如DpnII和MBoI都是GATCGATC

第四步:運(yùn)行

singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -i fastq -o results -c config-hicpro.txt ```

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容