背景:目前用于新一代的測序的主要儀器有Illumina/Solexa的Genome Analyzer、ABI的Solid和Roche的454,它們都能高通量的測序,產(chǎn)生大量的測序結(jié)果。接下來就要對序列進行拼接,用于拼接的軟件也有很多。這里我們將采用SPAdes和Velvet對同一組數(shù)據(jù)處理并比較。
處理的文件分別為test_7942raw_1.fq.gz和test_7942raw_2.fq.gz
SPAdes組裝
1、由于我的fq文件在Seqs目錄下,所以在test文件名前加上其路徑,且將文件輸出到Seqs目錄中

spades.py --careful --pe1-1 ~/Seqs/test_7942raw_1.fq.gz --pe1-2 ~/Seqs/test_7942raw_2.fq.gz -o ~/Seqs/SPAdesout_7942_new--注:pe1指第一個pe文庫,pe1-1是指第一個pe文庫的正向,pe1-2是指第一個pe文庫的反向 2、運行成功后,進入Seqs中查看:多了一個SPAdesout_7942_new文件

其中的contigs.fasta文件為quast處理文件
Velvet組裝
velvet的使用分為兩步:第一步是velveth利用數(shù)據(jù)構(gòu)建一個hash表,第二步是velvetg進行序列拼接
1、輸入代碼:(用velveth命令構(gòu)建一個hash表)
velveth velvet_out 31 -shortPaired -fastq -separate test_7942raw_1.fq.gz test_7942raw_2.fq.gz
(注意fq文件的路徑,若文件當(dāng)前目錄下,則可不用輸入路徑)

2、輸入代碼:(用velvetg命令進行組裝)
velvetg velvet_out -exp_cov auto -cov_cutoff auto -very_clean yes
3、就可以看到目錄下生成velvet.out文件
其中的contigs。fa為quast處理文件
QUAST判斷兩個軟件的評價效果
①spades
1、輸入代碼:
quast.py ~/Seqs/SPAdesout_7942/contigs.fasta -o ~/Seqs/SPAdesout_7942/quast_out
結(jié)果顯示在/Seqs/SPAdesout_7942/quast_out/下

2、在linux下打開report文件
less report.txt
②velvet
1、輸入代碼:
quast.py ~/Seqs/velvet_out/contigs.fa -o ~/Seqs/velvet_out/quast_out
輸出結(jié)果在/Seqs/velvet_out/quast_out/下

2、打開report文件

③比較
1、輸入代碼:./表示在當(dāng)前目錄下,使用的文件和輸出都在當(dāng)前目錄下
quast.py -o compare_spa_velvet ./SPAdesout_7942_new/contigs.fasta ./velvet_out/contigs.fa
如圖


3、查看比較結(jié)果,打開report.txt文件。兩個軟件拼接結(jié)果整合在一起
less report.txt