第一部分數(shù)據(jù)前處理(在得到一個vcf文件之后進行格式處理)
### 1.首先從vcf文件中提取個體
bcftools view -S 40ind.txt -Oz -o SCT_combine119.call.snp.filtered.2allelic.DP.0.02.maf0.05.chr2.40ind.vcf.gz SCT_combine119.call.snp.filtered.2allelic.DP.0.02.maf0.05.chr2.vcf.gz
### 2.vcf文件基因型|轉(zhuǎn)換為/
zcat SCT_combine119.call.snp.filtered.2allelic.DP.0.02.maf0.05.chr2.40ind.vcf.gz | awk '{gsub(/\|/, "/"); print}' | bgzip -c > SCT_combine119.call.snp.filtered.2allelic.DP.0.02.maf0.05.chr2.40ind_modified.vcf.gz
### 3.vcf文件去冗余
bcftools annotate -x ^FORMAT/GT -Oz -o SCT_combine119.call.snp.filtered.2allelic.DP.0.02.maf0.05.chr2.40ind_modified.clean.vcf.gz SCT_combine119.call.snp.filtered.2allelic.DP.0.02.maf0.05.chr2.40ind_modified.vcf.gz
### 4.提取個體編號
bcftools query -l SCT_combine119.call.snp.filtered.2allelic.DP.0.02.maf0.05.chr1.40ind_modified.clean.vcf.gz > sample_ids.txt
### 5.提取基因型信息
bcftools query -f '%CHROM\t%POS\t%REF\t%ALT[\t%GT]\n' SCT_combine119.call.snp.filtered.2allelic.DP.0.02.maf0.05.chr2.40ind_modified.clean.vcf.gz > genotypes_raw.txt
第二部分使用python腳本將基因型文件轉(zhuǎn)換為slim軟件可讀格式
python slim_read.py
第三部分運行slim腳本進行繁殖模擬
nohup slim step1.breeding_simulation.slim &
第四部分后代個體編號修改
python step2.vcf_ID_modify.py 081 160
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。