PGCGAP 是用于原核生物基因組學(xué)和比較基因組學(xué)分析管道,目前該管道包含 12 個模塊,可以接受 Illumina 雙端 reads、Oxford reads 或 PacBio reads 作為輸入,可以完成基因組組裝、基因預(yù)測和注釋,并可以進(jìn)行比較基因組學(xué)分析,包括構(gòu)建單拷貝核心蛋白進(jìn)化樹以及單拷貝核心基因 SNPs 進(jìn)化樹,泛基因組分析與進(jìn)化樹構(gòu)建,全基因組平均核苷酸一致性(ANI)計算,同源蛋白家族聚類及進(jìn)化樹構(gòu)建,COG 注釋,SNPs 和 INDELs calling,抗生素抗性基因 / 毒力因子預(yù)測,Multi-FASTA 進(jìn)化樹構(gòu)建,組裝后基因組短序列過濾與統(tǒng)計信息呈現(xiàn)(genome size,GC content……),序列提取,字符串去重復(fù)。CGAP更新詳情如下或移步官方文檔進(jìn)行查看(https://liaochenlanruo.fun/pgcgap/index-v1.0.35.html#--v1035):
Rewrite the module?Pan, Panaroo is used instead of Roary and the output files have changed, see?OUTPUT section?for details.
Added function?id2seq?to module?ACC?for extracting the corresponding sequences from a file to another file according to a number of ids in one file.
Added function?getRepeats?to module?ACC?for counting the number of repeats of the string for the specified column in a given file.
目前代碼已經(jīng)完成更新,并已經(jīng)將安裝腳本上傳至Bioconda。為了體驗新功能,請大家通過“pgcgap --check-update”進(jìn)行更新,最新版本號為v1.0.35(也可以全新安裝,見:?https://liaochenlanruo.fun/pgcgap/index-v1.0.35.html#installation)。PGCGAP會不定期更新,為了體驗最新功能,請大家不定時的檢查更新情況。
此外,Linux基礎(chǔ)薄弱的老師可以到https://github.com/liaochenlanruo/pgcgap/wiki進(jìn)行入門學(xué)習(xí)。
PGCGAP項目地址:https://github.com/liaochenlanruo/pgcgap
如果您覺得PGCGAP對您有幫助的話,可以分享給需要的老師和同學(xué)們,請大家多多支持,歡迎引用!
Liu H, Xin B, Zheng J, Zhong H, Yu Y, Peng D, Sun M. Build a bioinformatics analysis platform and apply it to routine analysis of microbial genomics and comparative genomics.?Protocol?exchange, 2021. DOI:?10.21203/rs.2.21224/v5 .