LDdecay使用介紹

介紹:使用PopLDdecay軟件生成群體的LD衰減圖。從大群體中提取subgroup的vcf作為PopLDdecay的輸入。
#!/bin/bash

SamLst=$1   ##- 每個(gè)樣本名一行
Prefix=$2

gvcf=$3

vcftools  --gzvcf  ${gvcf}  --recode --recode-INFO-all --stdout  --keep  ${SamLst}  > ${Prefix}.snp.vcf

bgzip  ${Prefix}.snp.vcf

tabix -p vcf  ${Prefix}.snp.vcf.gz

/data/mg1/caix/src/biosoft/PopLDdecay/PopLDdecay  -InVCF  ${Prefix}.snp.vcf.gz  -OutStat  ${Prefix}.LD.stat.gz

rm ${Prefix}.snp.vcf.gz  ${Prefix}.snp.vcf.gz.tbi

使用PopLDdecay中程序Plot_MultiPop.pl繪圖

perl  /data/mg1/caix/src/biosoft/PopLDdecay/bin/Plot_MultiPop.pl  -inList  Stat.Sp.Lst  -output  oilseed  -keepR

Stat.Sp.Lst文件格式:

/data/mg1/caix/works/Bra_reSeqProject_2022/Pop_analysis_0411/oilseed/LD_decay/plot/CAturnips.LD.stat.gz CAoilseed
/data/mg1/caix/works/Bra_reSeqProject_2022/Pop_analysis_0411/oilseed/LD_decay/plot/Oilseed.LD.stat.gz   ChineseOilseed
/data/mg1/caix/works/Bra_reSeqProject_2022/Pop_analysis_0411/oilseed/LD_decay/plot/sarson.LD.stat.gz    sarson

結(jié)果圖展示:

image.png

PS: 計(jì)算 the length of half-maximum decay of LD (calculate_LDlength.pl):

#!/usr/bin/perl -w
use strict;

my $in0 = $ARGV[0]; ##- sarson.LD.stat.gz

open IN0, "gzip -dc $in0 | ";
<IN0>;
my $firstLine = <IN0>;
chomp($firstLine);
my @firstLine = split(/\t/, $firstLine);
my $max = $firstLine[1];
close IN0;

my %dis2Value = ();
open IN1, "gzip -dc $in0 | ";
<IN1>;
while(<IN1>){
  chomp;
  my @temp = split(/\t/, $_);
  $dis2Value{$temp[0]} = $temp[1];
}
close IN1;

my $halfValue = $max/2;

for my $key1(sort {$a<=>$b} keys %dis2Value){

    my $next = $key1 + 1;
    
    if(exists $dis2Value{$next}) { 

       my $currentValue = $dis2Value{$key1};
       my $nextValue = $dis2Value{$next};
      
       if($currentValue >= $halfValue && $nextValue < $halfValue){
          print "Processing ", $in0, "\n";
          print "max LD: r2: ", $max, "\n";
          print "half LD:  r2: ", $halfValue, "\t", "LD length: ", $key1, "\n"; 
          last;
       } 

    }

}
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 在群體遺傳學(xué)分析中,我們經(jīng)常會(huì)碰到關(guān)于連鎖不平衡的問(wèn)題,當(dāng)然計(jì)算連鎖不平衡的軟件有很多,包括plink2、hapl...
    楊博士聊生信閱讀 14,071評(píng)論 1 25
  • 1 安裝PopLDdecay,優(yōu)點(diǎn):方便不需要轉(zhuǎn)換格式(plink需要) ## 下載 git clone http...
    鈴_0d92閱讀 2,457評(píng)論 0 5
  • 1.連鎖不平衡(LD)概念 連鎖不平衡(LD)是指不同位點(diǎn)等位基因的非隨機(jī)關(guān)聯(lián)。LD 的衰減是受重組率和重組代數(shù)影...
    DumplingLucky閱讀 9,698評(píng)論 0 11
  • 群體進(jìn)化與選擇信號(hào):●生活在世界不同區(qū)域的生物群體在歷史長(zhǎng)河中經(jīng)歷千萬(wàn)年的自然選擇、人工馴化、遷徙、遺傳漂變等事件...
    琴酒martini閱讀 27,543評(píng)論 6 100
  • 一次簡(jiǎn)化基因組數(shù)據(jù)分析實(shí)戰(zhàn) 盡管目前已經(jīng)有大量物種基因組釋放出來(lái),但還是存在許多物種是沒(méi)有參考基因組。使用基于酶切...
    xuzhougeng閱讀 15,578評(píng)論 10 40

友情鏈接更多精彩內(nèi)容