OmegaPlus?是一個用于檢測基因組數(shù)據(jù)中正選擇痕跡的生物信息學工具。基于單倍型頻率分布和重組事件檢測選擇信號,通過計算ω統(tǒng)計量(omega statistic)來識別選擇位點。
官方軟件提供了幾種不同的版本:
OmegaPlus:順序版本;
OmegaPlus-F:細粒度并行版本,適合在在更小的任務單位上并行化;
OmegaPlus-C:粗粒度并行版本,在較大的任務塊上分配工作,適合任務量較大的計算場景;
OmegaPlus-M:多粒度并行版本結合了細粒度和粗粒度的優(yōu)點,通常在實際計算中性能表現(xiàn)最佳。
示例:
./OmegaPlus-M -name TEST -input TEST.fasta -minwin 100 -maxwin 1000 -grid 10000 -threads 4
-name: 設置輸出文件的前綴,用于標記結果文件。
-input: 指定輸入文件(例如基因組序列文件)。
-minwin 和 -maxwin: 設置掃描窗口的范圍。
-grid: 決定基因組上劃分的網(wǎng)格數(shù)量,值越大分辨率越高,但計算量也越大。
-threads: 指定線程數(shù)量(僅用于并行版本)
其它可選參數(shù):
-name <STRING>
指定運行名稱,生成的輸出文件將以該名稱作為前綴。
-input <STRING>
輸入對齊文件的名稱。
-grid <INTEGER>
指定在對齊中計算 omega 值的網(wǎng)格數(shù),數(shù)值越大分辨率越高,但計算量更大。
-minwin <INTEGER>/-maxwin <INTEGER>
設置用于計算 SNPs 之間連鎖不平衡值的最小和最大窗口大小。
-length <INTEGER>
指定對齊長度,僅適用于 MS-like 和 MaCS-like 輸入文件。
-impute <N or GAP>
啟用對N或GAP符號的隨機插補,將它們轉(zhuǎn)換為有效字符。
可以使用兩次-impute分別處理N和GAP。
示例:-impute N -impute GAP。
-seed <INTEGER>
指定隨機數(shù)種子,用于插補N和GAP符號,或?qū)?DNA 對齊轉(zhuǎn)化為二進制數(shù)據(jù)。
必須與-impute和-binary一起使用。
-binary
將 DNA 對齊數(shù)據(jù)轉(zhuǎn)換為二進制格式。
-threads <INTEGER>
指定線程數(shù),僅適用于并行版本 OmegaPlus-F、OmegaPlus-C 和 OmegaPlus-M。
-minsnps <INTEGER>
指定子區(qū)域內(nèi)計算 omega 值的最小 SNP 數(shù)量。
示例:-minsnps 10。
-ld <STRING>
指定連鎖不平衡的測量類型,支持以下選項:
????RSQUARE(默認): SNPs 之間的相關系數(shù) r2。
????D: D 統(tǒng)計量。
????ABSD: D 的絕對值。
????DOM: D_omega 統(tǒng)計量。
????ABSDOM: D_omega 的絕對值。
????ABSDOM2: D_omega 的絕對值,按頻率乘積歸一化。
示例:-ld RSQUARE。
-maf <FLOAT>
排除次等位基因頻率低于閾值的 SNP。
-no-singletons
從分析中排除單一出現(xiàn)的 SNPs。
-b <INTEGER>
允許每個位置在左、右窗口中 SNPs 數(shù)目差異不超過<INTEGER>,實現(xiàn)對最佳 omega 值的近似搜索。
-all
輸出文件中顯示更多結果信息。
-reports
為每個對齊生成單獨的報告文件。
-sampleList <STRING>
用于 VCF 文件,指定需要包含的樣本。
-sampleList_out <STRING>
為輸入 VCF 文件生成樣本列表。
-mbs
指定輸入文件為 mbs 格式(將按 ms 格式處理)。
-noSeparator
禁止在輸出中打印//分隔符,便于元處理(如在 R 中處理結果)。
案例:


