2020-05-26 PASA 基因組結構注釋(debugging)

PASA 安裝perl 模塊GD DBD::myqcl?

1.利用cpan or cpanm安裝總提示報錯,未解決

再次利用yum install ‘perl(GD)' 安裝成功

2. 下載UniVec數據后,formatdb命令格式化數據,formatdb命令找不到

NCBI ftp下載了老版 blast 尋到了formatdb,折騰了一天時間,發(fā)現它生成格式與makeblastdb一樣

3.Trinity

合并多個bam文件

samtools merge -@ 16 zs.sort.merged.bam -b sort.merge.list (待合并文件列表)

Trinity --genome_guided_bam ../abhv-bam/zs.sort.merged.bam --genome_guided_max_intron 10000??

Trinity拼接利用基因組guide的模式,使用sort -n合并的bam文件報錯。

Error,read? entries are out of order

重新對bam文件按照read mapping所在位置進行排序 ,重新排序后可行

4.seqclean對拼接后序列進行修剪

直接上報錯,sh:/seqclean/bin/psx: /lib/ld-linux.so.2: bad ELF interpreter:No such file or directory

或者報錯:

-= Rebuilding sb-Trinity-GG.fasta cdb index =-

Error at cdbfasta workshop/sb-Trinity-GG.fasta -o sb-Trinity-GG.fasta.cidx

原因:現用linux為64位系統(tǒng),執(zhí)行32為程序出現/lib/ld-linux.so.2: bad ELF interpreter:No such file or directory?

安裝下glic即可解決? sudo yum install glibc.i686

seqclean ./workshop/sb-Trinity-GG.fasta -v /store_data/xls/biosoft/UniVec/UniVec

5. PASA的配置 conf.txt (源于pasa.CONFIG.template)

MYSQL_RW_USER=xls
MYSQL_RW_PASSWORD=123456?

MYSQL_RO_USER=pasa

MYSQL_RO_PASSWORD=123456

MYSQLSERVER=localhost

PASA_ADMIN_EMAIL=郵箱

BASE_PASA_URL=http://pasa-dev.tigr.org/cgi-bin

至此發(fā)現,當前版本為pasa-v2.2.0,很遺憾與構建好的mysql 8.0不兼容。

重新下載新目前最新版pasa-v2.4.1 提示mysql schema更新可兼容最新版mysql

6 conda環(huán)境影響pasa安裝運行,需要將環(huán)境變量中conda相關語句注釋掉,包含用戶及root賬戶中的bashrc文件。

開始conda直接安裝了gmap blat比對軟件,后續(xù)運行過程中報錯,卸載后手動安裝,可行。

7. pasa運行參數中需要提供轉錄組拼接后fasta fasta.clean文件,并且fasta.cln文件需要與上述兩文件出現在同一個文件夾中,不然報錯。(原因不詳,exploring)

生成mysql數據庫和表

./scripts/create_mysql_cdnaassembly_db.dbi -r -c alignAssembly.config -S ./schema/cdna_alignment_mysqlschema

運行PASA主程序將轉錄本序列比對到基因組上


../Launch_PASA_pipeline.pl -c alignAssembly.config -R -g OsHV-1.CDSB2012.fasta -t sb-Trinity-GG.fasta.clean -T -u sb-Trinity-GG.fasta --ALIGNERS gmap,blat --CPU 16 --stringent_alignment_overlap 80 --MAX_INTRON_LENGTH 20000 --TRANSDECODER

生成fasta.transdecoder.genome.gff3文件

../../scripts/pasa_asmbls_to_training_set.dbi --pasa_transcripts_fasta pasa_sboshv.assemblies.fasta --pasa_transcripts_gff3 pasa_sboshv.pasa_assemblies.gff3

(參考? http://www.chenlianfu.com/?p=1181? ??https://www.cnblogs.com/zhanmaomao/p/12456073.html? ?)

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容