有的時(shí)候在做數(shù)據(jù)分析的時(shí)候,會(huì)用到各種各樣的分析軟件,而每個(gè)分析軟件又有與之相匹配的輸入文件格式。格式不對(duì),會(huì)很麻煩,有時(shí)候會(huì)出現(xiàn)錯(cuò)誤的結(jié)果,甚至就不能運(yùn)行程序。而許多軟件之間的文件格式是可以相互轉(zhuǎn)化的。直接轉(zhuǎn)化就可以方便很多。今天就來(lái)講一講plink的ped和map文件與vcf文件的相互轉(zhuǎn)化。因?yàn)樵谠S多情況下這兩種文件格式是需要轉(zhuǎn)化的。
首先介紹一下由plink轉(zhuǎn)vcf
plink --file test --make-bed --out test_1 ###此步是將map和ped文件轉(zhuǎn)換為二進(jìn)制的文件
plink --bfile test_1 --recode vcf-iid --out test_vcf? ###這樣就把plink文件轉(zhuǎn)換成vcf格式了(很簡(jiǎn)單吧?。?/p>
然后在介紹一下將vcf格式文件轉(zhuǎn)化為plink格式文件
這個(gè)需要下載一個(gè)軟件vcftools,應(yīng)該是基于linux系統(tǒng)的,windows版本的好像沒(méi)有(我一直用linux版本的,windows我沒(méi)有找到)。https://jaist.dl.sourceforge.net/project/vcftools/vcftools_0.1.13.tar.gz(進(jìn)入這個(gè)網(wǎng)址就可以下載vcftools了),我認(rèn)為vcftools是一個(gè)很有用的軟件,比如他還可以計(jì)算遺傳分化指數(shù)(Fst)等。好了閑話少說(shuō),回歸正題。
vcftools --vcf xx.vcf --plink --out xx
哈哈,這個(gè)比上面的還要簡(jiǎn)單吧。真的說(shuō)不清楚,有時(shí)候程序和軟件真的很奇妙。