【plink系列】第2篇-如何修改plink里的樣本信息

接著上次寫了plink的第1篇基本格式后,小Q今天開始寫第2篇-如何修改plink里的樣本信息啦!

首先我們假設(shè)數(shù)據(jù)是這個樣子的,2個樣本,2個SNP,這里采用ped & map

plink.ped & plink.map
ped: 家庭ID 樣本ID 父親ID 母親ID 性別 疾病狀態(tài) SNP1的基因型 SNP2的基因型
ind1FID ind1IID F1 M1 1 0 A G G T
ind2FID ind2IID F2 M2 2 0 G G T T
map: 染色體號 SNPID 遺傳距離 物理距離
1 snp1 0 100
2 snp2 0 1000
這些信息怎么表示請見《第1篇-數(shù)據(jù)格式:http://www.itdecent.cn/p/ebaa8311b318

plink里記錄的樣本信息主要包括以下幾種:

  1. family ID:家庭ID
  2. 個體ID
  3. 父親ID
  4. 母親ID
  5. 性別
  6. 患病狀態(tài)

所以更新樣本信息主要是更新以下幾類:

  1. 樣本自己的ID
  • --update-ids expects input with the following four fields:
    Old family ID
    Old within-family ID
    New family ID
    New within-family ID
  • inputfile內(nèi)容如下
    ind1FID ind1IID ind1FID2 ind1IID2
  • 命令行
    plink --file plink --update-ids inputfile --recode --out newplink
  1. 父母的ID
  • --update-parents expects the following four fields:
    Family ID
    Within-family ID
    New paternal within-family ID
    New maternal within-family ID
  • inputfile內(nèi)容如下
    ind1FID ind1IID F1new M1new
  • 命令行
    plink --file plink --update-parents inputfile --recode --out newplink
  1. 性別
  • --update-sex
    Family ID
    Within-family ID
    sex information (1 or M = male, 2 or F = female, 0 = missing)
  • inputfile內(nèi)容如下
    ind1FID ind1IID 2
  • 命令行
    plink --file plink --update-sex inputfile --recode --out newplink

下期預(yù)告:

  • 第3篇-如何利用plink提取部分?jǐn)?shù)據(jù)
  • 第4篇-如何利用plink合并不同來源的數(shù)據(jù)
    ......

喜歡的小伙伴,點(diǎn)個喜歡或贊賞下吧!

轉(zhuǎn)載請標(biāo)明出處和作者 ^+^

撰文 & 編輯:VickieQ
校對:HCLO4 & 花毛

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容