組裝細(xì)菌基因組

組裝細(xì)菌基因組

一、從上Genome Announcements網(wǎng)站(https://mra.asm.org/)找一篇細(xì)菌基因組文章;找到文章記載的SRA號(hào),如SRR9305630

二、從SRA數(shù)據(jù)庫上用prefetch下載該文件

prefetch SRR9305630

三、Fastq-dump解壓

fastq-dump --gzip --split-files SRR9305630.sra

四、Fastqc評(píng)價(jià)數(shù)據(jù)質(zhì)量;

fastqc SRR9305630_1.fastq.gz
fastqc SRR9305630_2.fastq.gz

數(shù)據(jù)過濾,去接頭

java -jar ~/Biosofts/Trimmomatic038/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRR9305630_1.fastq.gz SRR9305630_2.fastq.gz ./output_forward_paired.fq.gz ./output_forward_unpaired.fq.gz ./output_reverse_paired.fq.gz ./output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/wangfuhao/Biosofts/Trimmomatic038/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75
image.png

五、Spades組裝基因組草圖
運(yùn)行 SPAdes 組裝細(xì)菌基因組

spades.py --careful --pe1-1 SRR9305630_1.fastq.gz --pe1-2 SRR9305630_2.fastq.gz -o ./SPAdesout_7942_new

出現(xiàn)錯(cuò)誤,內(nèi)存不夠


用seqtk抽取100000條再試試

先解壓
gunzip -c output_forward_paired.fq >output_forward_paired.fq
gunzip -c output_reserve_paired.fq >output_reserve_paired.fq
抽取100000條
seqtk sample -s 60 output_forward_paired.fq 100000 >seqtksample_100000.fq
seqtk sample -s 60 output_reserve_paired.fq 100000 >seqtksample2_100000.fq
再次執(zhí)行
spades.py --careful --pe1-1 seqtksample_100000.fq --pe1-2 100000 >seqtksample2_100000.fq -o ./SPAdesout_7942_new

有錯(cuò)誤,但是算是完成了這一步

六、Quast評(píng)價(jià)組裝的基因組效果

quast.py ~/ncbi/public/sra/SPAdesout_7942_new/contigs.fasta -o ~/SPAdesout_7942_new/quast_out

icarus下載到本地查看


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容