SPAdes與Velvet拼接序列 及QUAST評價兩者差異

背景:目前用于新一代的測序的主要儀器有Illumina/Solexa的Genome Analyzer、ABI的Solid和Roche的454,它們都能高通量的測序,產(chǎn)生大量的測序結(jié)果。接下來就要對序列進行拼接,用于拼接的軟件也有很多。這里我們將采用SPAdes和Velvet對同一組數(shù)據(jù)處理并比較。
處理的文件分別為test_7942raw_1.fq.gz和test_7942raw_2.fq.gz

SPAdes組裝

1、由于我的fq文件在Seqs目錄下,所以在test文件名前加上其路徑,且將文件輸出到Seqs目錄中

image.png
即輸入代碼:
spades.py --careful --pe1-1 ~/Seqs/test_7942raw_1.fq.gz --pe1-2 ~/Seqs/test_7942raw_2.fq.gz -o ~/Seqs/SPAdesout_7942_new
--注:pe1指第一個pe文庫,pe1-1是指第一個pe文庫的正向,pe1-2是指第一個pe文庫的反向

2、運行成功后,進入Seqs中查看:多了一個SPAdesout_7942_new文件
image.png

其中的contigs.fasta文件為quast處理文件

Velvet組裝

velvet的使用分為兩步:第一步是velveth利用數(shù)據(jù)構(gòu)建一個hash表,第二步是velvetg進行序列拼接

1、輸入代碼:(用velveth命令構(gòu)建一個hash表)
velveth velvet_out 31 -shortPaired -fastq -separate test_7942raw_1.fq.gz test_7942raw_2.fq.gz
(注意fq文件的路徑,若文件當(dāng)前目錄下,則可不用輸入路徑)

image.png

2、輸入代碼:(用velvetg命令進行組裝)
velvetg velvet_out -exp_cov auto -cov_cutoff auto -very_clean yes

3、就可以看到目錄下生成velvet.out文件
image.png

其中的contigs。fa為quast處理文件

QUAST判斷兩個軟件的評價效果

①spades

1、輸入代碼:
quast.py ~/Seqs/SPAdesout_7942/contigs.fasta -o ~/Seqs/SPAdesout_7942/quast_out
結(jié)果顯示在/Seqs/SPAdesout_7942/quast_out/下

image.png

2、在linux下打開report文件
less report.txt
image.png

②velvet

1、輸入代碼:
quast.py ~/Seqs/velvet_out/contigs.fa -o ~/Seqs/velvet_out/quast_out
輸出結(jié)果在/Seqs/velvet_out/quast_out/下

image.png

2、打開report文件
image.png

③比較

1、輸入代碼:./表示在當(dāng)前目錄下,使用的文件和輸出都在當(dāng)前目錄下
quast.py -o compare_spa_velvet ./SPAdesout_7942_new/contigs.fasta ./velvet_out/contigs.fa
如圖

image.png
2、運行成功后可以看到該目錄下多出一個compare_spa_velvet,即為比較的結(jié)果
image.png

3、查看比較結(jié)果,打開report.txt文件。兩個軟件拼接結(jié)果整合在一起
less report.txt
image.png
根據(jù)出來的n50和max contig長度來判斷拼接的效果

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容