stata命令詳解-groups

1. 前言

在目前工作中,用stata清洗及分析數(shù)據(jù),感覺很順滑。無奈不少同學(xué)因為help文件里的英文望而卻步。
帶著學(xué)習(xí)和分享的目的,根據(jù)工作經(jīng)驗,給大家整理一些常用以及不太常用但很有用的命令,并對該命令的help文件進(jìn)行有側(cè)重的詳解。

2. 命令及獲取

groups:分組顯示頻率和百分比,實現(xiàn)類似excel的數(shù)據(jù)透視表的功能,需要通過ssc install groups進(jìn)行安裝

groups安裝.png

3. 描述

groups :能夠?qū)崿F(xiàn)類似excel的數(shù)據(jù)透視表的功能,分組顯示頻數(shù)和百分比,按條件顯示結(jié)果,結(jié)果可以保存為數(shù)據(jù)集等功能。

4. 語法

groups varlist [if] [in] [weight] [, options]
  • [,]:中括號里的為額外選項命令,按需求添加,而添加選項記得加英文逗號,
  • [if]:表示增加條件,例如,變量var等于1, if var==1
  • [in]:表示選擇個案數(shù),例如,選擇前10個個案,in 1/10。

5. 選項

  • 命令選項:
    • fillin:添加本選項,將頻率為0的分組也顯示出來,若組數(shù)太多,慎重添加本選項。
    • ge:添加本選項,在計算累計頻率和百分比時,從當(dāng)前頻率和百分比開始計算。
    • lt:添加本選項,在計算累計頻率和百分比時,從前一項的頻率和百分比計算。
    • missing:添加本選項,缺失的個案也會作為一類呈現(xiàn)。默認(rèn)不顯示缺失的個案。
    • select(condition|#):添加本選項,有條件的顯示結(jié)果。
    • select(5)select(-5)分別表示顯示前5類結(jié)果,后5類結(jié)果。
    • select(freq==1),select(Freq==1),select(RFreq==1): 分別表示呈現(xiàn)頻率,累計頻率,倒累計頻率為1的結(jié)果。注意,freq,Freq,RFreq大小寫不同含義不同。
    • select(percent>5),select(Percent>5),select(RPercent>5): 分別表示呈現(xiàn)百分比,累計百分比,倒累計百分比大于5的結(jié)果。注意,percent,Percent,RPercent大小寫不同含義不同。
    • select(vpercent<50),select(Vpercent<50),select(rvpercent<50):分別表示呈現(xiàn)有效百分比,有效累計百分比,倒有效累計百分比小于50的結(jié)果。注意vpercent,Vpercent,rvpercent大小寫不同含義不同。
    • show(what_to_show):添加本選項,指定呈現(xiàn)什么樣的結(jié)果。默認(rèn),一個變量顯示頻率,百分比和累計百分比;二個及以上變量顯示頻率和百分比。顯示結(jié)果包括:freq(頻率),Freq(累計頻率),RFreq(倒累計頻率),percent(百分比),Percent(累計百分比),RPercent(倒累計百分比),vpercent(有效百分比),Vpercent(有效累計百分比),rvpercent(倒有效累計百分比)。
    • percentvar(varlist):添加本選項,表明按某些變量呈現(xiàn)子百分比。
  • 展示選項:
    • format(format):添加本選項,指定結(jié)果呈現(xiàn)格式,默認(rèn)為format(%6.2f),保留2位小數(shù)。
    • list_options:即和命令list的選項相同。
    • order(high|low):添加本選項,指定結(jié)果的頻率排序是倒序還是順序。
    • reverse:添加本選項,指定呈現(xiàn)結(jié)果的類別倒序呈現(xiàn)。
    • showhead(text):添加本選項,指定呈現(xiàn)結(jié)果中的統(tǒng)計量的名稱,例如,,show(fre per vpercent) showhead("頻率" "百分比" "有效百分比")
    • colorder(integers):添加本選項,可以調(diào)整結(jié)果的列的呈現(xiàn)順序,例如,,colorder(4 3 1 2)表示將默認(rèn)的列的順序按照第4列,第3列,第1列,第2列呈現(xiàn)。
  • 保存結(jié)果:
    • saving(filename[,save_options]):添加本選項,可以將呈現(xiàn)結(jié)果保存為.dta數(shù)據(jù),并且,可以使用命令save的選項。不可和by結(jié)合使用。

6. 舉例

  • groups命令結(jié)果

    groups.png

    • 對比命令tabulate

      tabulate.png

    • 單個變量時,默認(rèn)呈現(xiàn)頻率百分比累計百分比結(jié)果。

    • 多個變量時,按照變量順序排序呈現(xiàn),默認(rèn)呈現(xiàn)頻率百分比結(jié)果。

  • fillin選項增加效果:將頻率為0的類別也呈現(xiàn)出來

    fillin.png

  • gelt選項增加效果:前者從當(dāng)前頻率和百分比開始計算;后者從前一項頻率和百分比開始計算

    ge和lt.png

  • missing選項增加效果:缺失的個案也會作為一類呈現(xiàn)

    missing.png

  • select(condition|#)選項增加效果:有條件地呈現(xiàn)結(jié)果

    select.png

  • show(what_to_show)選項增加效果:指定呈現(xiàn)頻率,百分比,累計頻率,累計百分比,倒累計頻率,倒累計百分比,有效百分比,有效累計百分比,倒有效累計百分比

show.png
  • percentvar(varlist)選項增加效果:分類呈現(xiàn)子百分比

    percentvar.png

  • format(format)選項增加效果:結(jié)果的百分比呈現(xiàn)1位小數(shù)

    format.png

  • order(high|low)選項增加效果:分別按照頻率進(jìn)行倒序和順序排序

    order.png

  • reverse選項增加效果:將分組類別倒序呈現(xiàn)

    reverse.png

  • showhead(text),colorder(integers),saving(filename[,save_options])選項增加效果:統(tǒng)計量標(biāo)簽中文太長可能顯示不全,但在保存為數(shù)據(jù)集時變成變量標(biāo)簽是全的。

    final.png

7. 菜單

8. 存儲的結(jié)果

9. 補充

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容