Stata中字符型變量生成數(shù)值型變量
stata中在將純字符型變量(如A,B,A1)生成新的數(shù)值型變量(只能生成,不能轉(zhuǎn)換)時,有2種方式:
1、encode: encode 字符變量,gen(新的數(shù)值變量)
這種方法在產(chǎn)生新的數(shù)值變量的同時,把原字符變量作為標簽添加到新的數(shù)值變量上,如果在數(shù)據(jù)窗口查看數(shù)據(jù)是藍色的。
但這種方法只能處理字符種類少的情況,否則會出現(xiàn)命令提示too many values
這是可以采用下一種方法。
2、egen的group函數(shù): egen 新的數(shù)值變量=group(字符變量)
但這個命令只能產(chǎn)生新的數(shù)值變量,但沒有給數(shù)值變量添加標簽。
如果想添加標簽,可以用一個外部命令添加。
簡單例子
*安裝命令
net describe labutil, from(http://fmwww.bc.edu/RePEc/bocode/l)
net install labutil.pkg
clear
input ///
str2 id
A
B
A1
end
*方法1
encode id,gen(id1)
*方法2
egen id2=group(id)
list
*添加標簽
labmask id2, val(id)
list
*刪除標簽對比兩個命令產(chǎn)生的結(jié)果
label drop _all
list