多倍體染色體分型掛載方法推薦:C-Phasing

多倍體中組裝染色體水平的基因組,除了ALLHiC/HapHiC, 大家還可以嘗試一款新的軟件C-Phasing,該軟件主要基于Pore-C數(shù)據(jù)開發(fā),同時(shí)也兼容Hi-C數(shù)據(jù)。

安裝流程

下載軟件并使用conda 構(gòu)建環(huán)境安裝依賴

git clone https://github.com/wangyibin/CPhasing.git
cd CPhasing
conda env create -f environment.yml
conda activate cphasing

配置軟件路徑到bash環(huán)境

  • vim ~/.bash_profile
export PATH=/path/to/CPhasing/bin:$PATH
export PYTHONPATH=/path/to/CPhasing:$PYTHONPATH

軟件運(yùn)行方法

輸入Pore-C數(shù)據(jù)

輸入contig水平的基因組contigs.fasta和Pore-C數(shù)據(jù)porec.fastq.gz,根據(jù)倍性和染色體基數(shù)設(shè)置-n參數(shù),例如,組裝一個(gè)2n=4x=32的多倍體,則設(shè)置為-n 8:4。

cphasing pipeline -f contigs.fasta -pcd porec.fastq.gz -t 40 -n 8:4 

輸入Hi-C數(shù)據(jù)

cphasing pipeline -f contigs.fasta -hic1 hic_R1.fastq.gz -hic2 hic_R2.fastq.gz -t 40 -n 8:4

具體性能官方未描述

下載了一個(gè)同源四倍體(2n=10x=40)的基因組和Hi-C數(shù)據(jù)進(jìn)行測(cè)試,運(yùn)行命令如下:

source activate cphasing
cphasing pipeline -f contigs.fasta -hic1 SRR22405988_Hi-C_reads_of_S._spontaneum_Np-X_1.fastq.gz -hic2 SRR22405988_Hi-C_reads_of_S._spontaneum_Np-X_2.fastq.gz -t 30 -n 10:4

最終從cphasing_out/5.plot里面直接出圖,效果看起來非常好,30個(gè)線程耗時(shí)4個(gè)小時(shí)。

NpX_CPhasing_test.heatmap.png

參考

https://github.com/wangyibin/CPhasing

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容