導(dǎo)讀
SPAdes是2012年發(fā)表在Journal of Computational Biology上的一篇文章提出的二代測(cè)序組裝軟件,是目前引用量已經(jīng)達(dá)到6200+,在宏基因組組裝軟件中引用量最高【其他組學(xué)不清楚了】。SPAdes不僅推出rnaSPAdes【轉(zhuǎn)錄組】、metaSPAdes【宏基因組】、plasmindSPAdes【質(zhì)?!?,還推出了可以用于二代、三代測(cè)序數(shù)據(jù)混合組裝的hybrid SPAdes功能。SPAdes雖然在速度、效率上比不過(guò)megahit,但SPAdes內(nèi)部含校錯(cuò)功能,組裝更加準(zhǔn)確,也因此適合二代、三代混合組裝。


官網(wǎng):http://cab.spbu.ru/software/spades/
一、SPAdes相關(guān)的文章
【1】SPAdes
文章:SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing
雜志:J Comput Biol.
時(shí)間:2012
引用:6241+
【2】plasmidSPAdes
雜志:plasmidSPAdes: assembling plasmids from whole genome sequencing data
雜志:Bioinformatics
時(shí)間:2016
【3】hybridSPAdes
文章:hybridSPAdes: an algorithm for hybrid assembly of short and long reads
雜志:Bioinformatics
時(shí)間:2016
【4】metaSPAdes
文章:metaSPAdes: a new versatile metagenomic assembler
雜志:Genome Res.
時(shí)間:2017
【5】rnaSPAdes
文章:rnaSPAdes: a de novo transcriptome assembler and its application to RNA-Seq data
雜志:Gigascience
時(shí)間:2019
二、下載、安裝SPAdes
wget -c http://cab.spbu.ru/files/release3.14.0/SPAdes-3.14.0-Linux.tar.gz
# 下載目前最新版spades3.14.0
# 下載解壓即可使用
meta rna plasmind都在里面了,hybrid在spades中使用混合組裝參數(shù)即可【在下面了】

conda安裝
conda create -n assembly
conda activate assembly
conda install spades
三、SPAdes混合組裝二代、三代
在軟件canu文章的補(bǔ)充材料中看到了SPAdes混合組裝的方法。
軟件:canu
文章:Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation
雜志:Genome Research
時(shí)間:2017
引用:1220+
illumina混合pacbio組裝:
./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --pacbio [pacbio.fa] -t 52 -m 400 -o hybrid_pacbio
illumina混合nanopore組裝:
./spades.py -1 [illumina1.fq] -2 [illumina2.fq] --pacbio [ont.fasta] -t 52 -m 400 -o hybrid_nanopore
結(jié)果

四、SPAdes組裝二代
下載解壓最新版
wget -c http://cab.spbu.ru/files/release3.15.2/SPAdes-3.15.2-Linux.tar.gz
tar -zxvf SPAdes-3.15.2-Linux.tar.gz
cd SPAdes-3.15.2-Linux/bin/
./spades.py --help
組裝meta測(cè)序數(shù)據(jù)
/public/home/zzumgg03/huty/softwares/SPAdes-3.15.2-Linux/bin/./spades.py \
--meta -t 2 -m 10 \
-1 SRR341593_bowtie2.1.fastq \
-2 SRR341593_bowtie2.2.fastq \
-o out_dir
# m, memeory 250G by default
# t, thread 16 by default
spades只支持fastq文件,fasta文件不能用
五,組裝質(zhì)粒
質(zhì)控
kneaddata \
-i ./rawdata/FC2282_FDSW210258126-1r_1.fq \
-i ./rawdata/FC2282_FDSW210258126-1r_2.fq \
-o ./cleandata/ \
--trimmomatic /route/miniconda3/envs/kneaddata/share/trimmomatic/ \
-t 4 \
--trimmomatic-options "SLIDINGWINDOW:4:20 MINLEN:50" \
--remove-intermediate-output

上下游序列一共1G數(shù)據(jù)量,spades比較吃內(nèi)存,內(nèi)存不夠后期會(huì)報(bào)錯(cuò),下面分配50G memory做組裝。軟件默認(rèn)是250G mem 16 threads。
組裝
$route/plasmidspades.py \
-1 ./cleandata/FC2282_FDSW210258126-1r_1_kneaddata.trimmed.1.fastq \
-2 ./cleandata/FC2282_FDSW210258126-1r_1_kneaddata.trimmed.2.fastq \
--threads 16 \
--memory 50 \
-o ./assembly/
結(jié)果
