接著上次寫了plink的第1篇基本格式后,小Q今天開始寫第2篇-如何修改plink里的樣本信息啦!
- 第1篇-數(shù)據(jù)格式:http://www.itdecent.cn/p/ebaa8311b318
首先我們假設(shè)數(shù)據(jù)是這個樣子的,2個樣本,2個SNP,這里采用ped & map
plink.ped & plink.map
ped: 家庭ID 樣本ID 父親ID 母親ID 性別 疾病狀態(tài) SNP1的基因型 SNP2的基因型
ind1FID ind1IID F1 M1 1 0 A G G T
ind2FID ind2IID F2 M2 2 0 G G T T
map: 染色體號 SNPID 遺傳距離 物理距離
1 snp1 0 100
2 snp2 0 1000
這些信息怎么表示請見《第1篇-數(shù)據(jù)格式:http://www.itdecent.cn/p/ebaa8311b318》
plink里記錄的樣本信息主要包括以下幾種:
- family ID:家庭ID
- 個體ID
- 父親ID
- 母親ID
- 性別
- 患病狀態(tài)
所以更新樣本信息主要是更新以下幾類:
- 樣本自己的ID
- --update-ids expects input with the following four fields:
Old family ID
Old within-family ID
New family ID
New within-family ID - inputfile內(nèi)容如下
ind1FID ind1IID ind1FID2 ind1IID2 - 命令行
plink --file plink --update-ids inputfile --recode --out newplink
- 父母的ID
- --update-parents expects the following four fields:
Family ID
Within-family ID
New paternal within-family ID
New maternal within-family ID - inputfile內(nèi)容如下
ind1FID ind1IID F1new M1new - 命令行
plink --file plink --update-parents inputfile --recode --out newplink
- 性別
- --update-sex
Family ID
Within-family ID
sex information (1 or M = male, 2 or F = female, 0 = missing) - inputfile內(nèi)容如下
ind1FID ind1IID 2 - 命令行
plink --file plink --update-sex inputfile --recode --out newplink
下期預(yù)告:
- 第3篇-如何利用plink提取部分?jǐn)?shù)據(jù)
- 第4篇-如何利用plink合并不同來源的數(shù)據(jù)
......
喜歡的小伙伴,點(diǎn)個喜歡或贊賞下吧!
轉(zhuǎn)載請標(biāo)明出處和作者 ^+^
撰文 & 編輯:VickieQ
校對:HCLO4 & 花毛