SPAdes組裝二代、三代測(cè)序數(shù)據(jù)

導(dǎo)讀

SPAdes是2012年發(fā)表在Journal of Computational Biology上的一篇文章提出的二代測(cè)序組裝軟件,是目前引用量已經(jīng)達(dá)到6200+,在宏基因組組裝軟件中引用量最高【其他組學(xué)不清楚了】。SPAdes不僅推出rnaSPAdes【轉(zhuǎn)錄組】、metaSPAdes【宏基因組】、plasmindSPAdes【質(zhì)?!?,還推出了可以用于二代、三代測(cè)序數(shù)據(jù)混合組裝的hybrid SPAdes功能。SPAdes雖然在速度、效率上比不過(guò)megahit,但SPAdes內(nèi)部含校錯(cuò)功能,組裝更加準(zhǔn)確,也因此適合二代、三代混合組裝。

官網(wǎng):http://cab.spbu.ru/software/spades/

一、SPAdes相關(guān)的文章

【1】SPAdes

文章:SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing
雜志:J Comput Biol.
時(shí)間:2012
引用:6241+

【2】plasmidSPAdes

雜志:plasmidSPAdes: assembling plasmids from whole genome sequencing data
雜志:Bioinformatics
時(shí)間:2016

【3】hybridSPAdes

文章:hybridSPAdes: an algorithm for hybrid assembly of short and long reads
雜志:Bioinformatics
時(shí)間:2016

【4】metaSPAdes

文章:metaSPAdes: a new versatile metagenomic assembler
雜志:Genome Res.
時(shí)間:2017

【5】rnaSPAdes

文章:rnaSPAdes: a de novo transcriptome assembler and its application to RNA-Seq data
雜志:Gigascience
時(shí)間:2019

二、下載、安裝SPAdes

wget -c http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Linux.tar.gz
# 下載目前最新版spades3.14.0
# 下載解壓即可使用

meta rna plasmind都在里面了,hybrid在spades中使用混合組裝參數(shù)即可【在下面了】

bin目錄下的可執(zhí)行文件

conda安裝

conda create -n assembly
conda activate assembly
conda install spades

三、SPAdes混合組裝二代、三代

在軟件canu文章的補(bǔ)充材料中看到了SPAdes混合組裝的方法。

軟件:canu
文章:Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation
雜志:Genome Research
時(shí)間:2017
引用:1220+

illumina混合pacbio組裝:

./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --pacbio [pacbio.fa] -t 52 -m 400 -o hybrid_pacbio

illumina混合nanopore組裝:

./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --pacbio [ont.fasta] -t 52 -m 400 -o hybrid_nanopore

結(jié)果

四、SPAdes組裝二代

下載解壓最新版

wget -c http://cab.spbu.ru/files/release3.15.2/SPAdes-3.15.2-Linux.tar.gz
tar -zxvf SPAdes-3.15.2-Linux.tar.gz
cd SPAdes-3.15.2-Linux/bin/
./spades.py --help

組裝meta測(cè)序數(shù)據(jù)

/public/home/zzumgg03/huty/softwares/SPAdes-3.15.2-Linux/bin/./spades.py \
--meta -t 2 -m 10 \
-1 SRR341593_bowtie2.1.fastq \
-2 SRR341593_bowtie2.2.fastq \
-o out_dir
# m, memeory 250G by default
# t, thread 16 by default

spades只支持fastq文件,fasta文件不能用

五,組裝質(zhì)粒

質(zhì)控

kneaddata \
-i ./rawdata/FC2282_FDSW210258126-1r_1.fq \
-i ./rawdata/FC2282_FDSW210258126-1r_2.fq \
-o ./cleandata/ \
--trimmomatic /route/miniconda3/envs/kneaddata/share/trimmomatic/ \
-t 4 \
--trimmomatic-options "SLIDINGWINDOW:4:20 MINLEN:50" \
--remove-intermediate-output

上下游序列一共1G數(shù)據(jù)量,spades比較吃內(nèi)存,內(nèi)存不夠后期會(huì)報(bào)錯(cuò),下面分配50G memory做組裝。軟件默認(rèn)是250G mem 16 threads。

組裝

$route/plasmidspades.py \
-1 ./cleandata/FC2282_FDSW210258126-1r_1_kneaddata.trimmed.1.fastq \
-2 ./cleandata/FC2282_FDSW210258126-1r_1_kneaddata.trimmed.2.fastq \
--threads 16 \
--memory 50 \
-o ./assembly/

結(jié)果

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容