組裝細(xì)菌基因組

步驟如下:

1.上Genome Announcements網(wǎng)站(https://mra.asm.org/)找一篇細(xì)菌基因組文章;找到文章記載的SRA號

引用該篇文章的SRA號https://mra.asm.org/content/5/15/e00171-17

該文章的SRA號SRR5210995

2.從SRA數(shù)據(jù)庫上用prefetch下載該文件

prefetch SRR5210995

得到如下結(jié)果


該文件已成功下載

3.Fastq-dump解壓

fastq-dump --split-files ~/ncbi/public/sra/SRR5210995.sra
fastq-dump --gzip --split-files ~/ncbi/public/sra/SRR5210995.sra

結(jié)果如下


文件解壓成功

4.對原始數(shù)據(jù)進(jìn)行fastqc質(zhì)量檢測

fastqc SRR5210995_1.fastq.gz
fastqc SRR5210995_2.fastq.gz

結(jié)果如下


質(zhì)控完成

去圖形界面找到結(jié)果文件,打開


SRR5210995_1.fastq.gz的結(jié)果

SRR5210995_2.fastq.gz結(jié)果

5.原始數(shù)據(jù)過濾

mkdir trim_out
java -jar ~/Biosofts/Trimmomatic038/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRR5210995_1.fastq.gz SRR5210995_2.fastq.gz
./trim_out/output_forward_paired.fq.gz ./trirm_out/output_forward_unpaired.fq.gz ./trim_out/output_reverse_paired.fq.gz ./trim_out/output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/eris/Biosofts/Trimmomatic038/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75

結(jié)果如下


數(shù)據(jù)過濾成功

6.再次查看質(zhì)量

此時一定要選paired

cd /home/eris/trim_out
fastqc output_forward_paired.fq.gz
提示成功

再去圖形界面查看


結(jié)果

7.運(yùn)行SPAdes,組裝細(xì)菌基因組

cd ~ 
spades.py --careful --pe1-1 SRR5210995_1.fastq.gz --pe1-2 SRR5210995_2.fastq.gz -o ./SPAdesout_SRR5210995

一定要確保自己的內(nèi)存足夠,不然會出現(xiàn)error:out of memory
結(jié)果圖如下


成功

8.Quast評價組裝的基因組效果

quast.py ~/SPAdesout_SRR5210995/contigs.fasta -o ~/SPAdesout_SRR5210995/quast_out

結(jié)果如下


顯示成功

去圖形界面下打開html


結(jié)果圖
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容