[隨筆]minimap2 節(jié)約內(nèi)存

minimap2 我是用10G 以上基因組 +100G reads

默認參數(shù)下
一般消耗20-40G 內(nèi)存；
存入文件時消耗80G

后來思考，-I 參數(shù)，對于一些大基因組可以以消耗時間為代價，降低內(nèi)存消耗

-I NUM  Load at most NUM target bases into RAM for indexing [4G]. If there are more than NUM bases in target.fa,
 minimap2 needs to read query.fa multiple times to map it against each batch of target sequences. 
NUM may be ending with k/K/m/M/g/G. NB: mapping quality is incorrect given a multi-part index.

Note：如果基因組大于 -I 設(shè)置的大小，就會是 multi-part index；
這時副作用
(1) 比對質(zhì)量（mapping quality ）會不準確，根據(jù)需要進行取舍
(2) 使用 -a 參數(shù)，以 sam 格式輸出,則不會有前面的SQ 行；

@SQ SN:C14E LN:145181

建議還在用sam 格式的同學(xué) 轉(zhuǎn)戰(zhàn) paf 格式吧，長度信息都在paf 中
PAF: a Pairwise mApping Format

Col Type    Description
1   string  Query sequence name
2   int Query sequence length
3   int Query start (0-based; BED-like; closed)
4   int Query end (0-based; BED-like; open)
5   char    Relative strand: "+" or "-"
6   string  Target sequence name
7   int Target sequence length
8   int Target start on original strand (0-based)
9   int Target end on original strand (0-based)
10  int Number of residue matches
11  int Alignment block length
12  int Mapping quality (0-255; 255 for missing)

默認-I 是4G ；也就是如果基因組過大，拆分為多份多次導(dǎo)入內(nèi)存中比對；
以比對時間為代價降低內(nèi)存消耗，建立索引時修改 -I 參數(shù)

minimap2 -I 3G -d  ref.mmi  ref.fasta

最后編輯于：2020.01.17 11:16:18

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

[隨筆]minimap2 節(jié)約內(nèi)存

[隨筆]minimap2 節(jié)約內(nèi)存

@SQ SN:C14E LN:145181

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

[隨筆]minimap2 節(jié)約內(nèi)存

@SQ SN:C14E LN:145181

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av