組裝細(xì)菌基因組
一、從上Genome Announcements網(wǎng)站(https://mra.asm.org/)找一篇細(xì)菌基因組文章;找到文章記載的SRA號(hào),如SRR9305630
二、從SRA數(shù)據(jù)庫上用prefetch下載該文件
prefetch SRR9305630
三、Fastq-dump解壓
fastq-dump --gzip --split-files SRR9305630.sra
四、Fastqc評(píng)價(jià)數(shù)據(jù)質(zhì)量;
fastqc SRR9305630_1.fastq.gz
fastqc SRR9305630_2.fastq.gz
數(shù)據(jù)過濾,去接頭
java -jar ~/Biosofts/Trimmomatic038/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRR9305630_1.fastq.gz SRR9305630_2.fastq.gz ./output_forward_paired.fq.gz ./output_forward_unpaired.fq.gz ./output_reverse_paired.fq.gz ./output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/wangfuhao/Biosofts/Trimmomatic038/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
image.png
五、Spades組裝基因組草圖
運(yùn)行 SPAdes 組裝細(xì)菌基因組
spades.py --careful --pe1-1 SRR9305630_1.fastq.gz --pe1-2 SRR9305630_2.fastq.gz -o ./SPAdesout_7942_new
出現(xiàn)錯(cuò)誤,內(nèi)存不夠
用seqtk抽取100000條再試試
先解壓
gunzip -c output_forward_paired.fq >output_forward_paired.fq
gunzip -c output_reserve_paired.fq >output_reserve_paired.fq
抽取100000條
seqtk sample -s 60 output_forward_paired.fq 100000 >seqtksample_100000.fq
seqtk sample -s 60 output_reserve_paired.fq 100000 >seqtksample2_100000.fq
再次執(zhí)行
spades.py --careful --pe1-1 seqtksample_100000.fq --pe1-2 100000 >seqtksample2_100000.fq -o ./SPAdesout_7942_new
有錯(cuò)誤,但是算是完成了這一步
六、Quast評(píng)價(jià)組裝的基因組效果
quast.py ~/ncbi/public/sra/SPAdesout_7942_new/contigs.fasta -o ~/SPAdesout_7942_new/quast_out
icarus下載到本地查看









