背景
- 我在利用stata寫實(shí)證文章的時(shí)候,容易遇到一個(gè)問題,就是在輸出實(shí)證表格時(shí),由于某些變量的缺失,導(dǎo)致輸出的描述性統(tǒng)計(jì)的樣本數(shù)和主回歸的樣本數(shù)不一致。
- 一個(gè)解決的辦法是,對(duì)參與主回歸的變量,若存在缺失,則刪去缺失的樣本。
- 只是,在一篇文章中,主回歸之后,往往還有多個(gè)回歸方程,如果把主回歸的變量存在缺失值的樣本全部刪去,則可能會(huì)損失一些后續(xù)回歸可能用得上的樣本。
- 一個(gè)似乎更佳的辦法是,標(biāo)記參與了主回歸的樣本,單獨(dú)對(duì)這部分樣本進(jìn)行描述性統(tǒng)計(jì)。
實(shí)現(xiàn)
sysuse auto, clear
su price rep78 weight length foreign
reg price rep78 weight length foreign
gen esample=1 if e(sample) //標(biāo)記參與了回歸的樣本
su price rep78 weight length foreign if esample==1
