极品男人污污污,97久久一区二区网址,20分钟超爽视频

（轉(zhuǎn)自http://www.douban.com/group/topic/14820131/，轉(zhuǎn)自人大論壇）

調(diào)整變量格式：

format x1 %10.3f ——將x1的列寬固定為10，小數(shù)點(diǎn)后取三位

format x1 %10.3g ——將x1的列寬固定為10，有效數(shù)字取三位

format x1 %10.3e ——將x1的列寬固定為10，采用科學(xué)計(jì)數(shù)法

format x1 %10.3fc ——將x1的列寬固定為10，小數(shù)點(diǎn)后取三位，加入千分位分隔符

format x1 %10.3gc ——將x1的列寬固定為10，有效數(shù)字取三位，加入千分位分隔符

format x1 %-10.3gc ——將x1的列寬固定為10，有效數(shù)字取三位，加入千分位分隔符，加入“-”表示左對(duì)齊

合并數(shù)據(jù)：

use "C:\\Documents and Settings\\xks\\桌面\\2006.dta", clear

merge using "C:\\Documents and Settings\\xks\\桌面\\1999.dta"

——將1999和2006的數(shù)據(jù)按照樣本（observation）排列的自然順序合并起來(lái)

use "C:\\Documents and Settings\\xks\\桌面\\2006.dta", clear

merge id using "C:\\Documents and Settings\\xks\\桌面\\1999.dta" ,unique sort

——將1999和2006的數(shù)據(jù)按照唯一的（unique）變量id來(lái)合并，在合并時(shí)對(duì)id進(jìn)行排序（sort）

【建議采用第一種方法?！?/p>

對(duì)樣本進(jìn)行隨機(jī)篩選：

sample 50 ? ? ? ? ? ?在觀測(cè)案例中隨機(jī)選取50%的樣本，其余刪除

sample 50,count ? 在觀測(cè)案例中隨機(jī)選取50個(gè)樣本，其余刪除

查看與編輯數(shù)據(jù)：

browse x1 x2 if x3>3 （按所列變量與條件打開(kāi)數(shù)據(jù)查看器）

edit x1 x2 if x3>3 （按所列變量與條件打開(kāi)數(shù)據(jù)編輯器）

數(shù)據(jù)合并（merge）與擴(kuò)展（append）

merge表示樣本量不變，但增加了一些新變量；append表示樣本總量增加了，但變量數(shù)目不變。

〇 one-to-one merge：數(shù)據(jù)源自stata tutorial中的exampw1和exampw2

第一步：將exampw1按v001～v003這三個(gè)編碼排序，并建立臨時(shí)數(shù)據(jù)庫(kù)tempw1

clear

use "t:\\statatut\\exampw1.dta"

su ——summarize的簡(jiǎn)寫(xiě)

sort v001 v002 v003

save tempw1

第二步：對(duì)exampw2做同樣的處理

clear

use "t:\\statatut\\exampw2.dta"

sort v001 v002 v003

save tempw2

第三步：使用tempw1數(shù)據(jù)庫(kù)，將其與tempw2合并：

clear

use tempw1

merge v001 v002 v003 using tempw2

第四步：查看合并后的數(shù)據(jù)狀況：

ta _merge ——tabulate _merge的簡(jiǎn)寫(xiě)

第五步：清理臨時(shí)數(shù)據(jù)庫(kù)，并刪除_merge，以免日后合并新變量時(shí)出錯(cuò)

erase tempw1.dta

erase tempw2.dta

drop _merge

數(shù)據(jù)擴(kuò)展append：

數(shù)據(jù)源自stata tutorial中的fac19和newfac

clear

use "t:\\statatut\\fac19.dta"

ta region

append using "t:\\statatut\\newfac"

ta region

合并后樣本量增加，但變量數(shù)不變

莖葉圖：

stem x1,line(2) （做x1的莖葉圖，每一個(gè)十分位的樹(shù)莖都被拆分成兩段來(lái)顯示，前半段為0～4，后半段為5～9）

stem x1,width(2) （做x1的莖葉圖，每一個(gè)十分位的樹(shù)莖都被拆分成五段來(lái)顯示，每個(gè)小樹(shù)莖的組距為2）

stem x1,round(100) （將x1除以100后再做x1的莖葉圖）

直方圖

采用auto數(shù)據(jù)庫(kù)

histogram mpg, discrete frequency normal xlabel(1(1)5)

（discrete表示變量不連續(xù)，frequency表示顯示頻數(shù)，normal加入正太分布曲線(xiàn)，xlabel設(shè)定x軸，1和5為極端值，(1)為單位）

histogram price, fraction norm

（fraction表示y軸顯示小數(shù)，除了frequency和fraction這兩個(gè)選擇之外，該命令可替換為“percent”百分比，和“density”密度；未加上discrete就表示將price當(dāng)作連續(xù)變量來(lái)繪圖）

histogram price, percent by(foreign)

（按照變量“foreign”的分類(lèi)，將不同類(lèi)樣本的“price”繪制出來(lái)，兩個(gè)圖分左右排布）

histogram mpg, discrete by(foreign, col(1))

（按照變量“foreign”的分類(lèi)，將不同類(lèi)樣本的“mpg”繪制出來(lái)，兩個(gè)圖分上下排布）

histogram mpg, discrete percent by(foreign, total) norm

（按照變量“foreign”的分類(lèi)，將不同類(lèi)樣本的“mpg”繪制出來(lái)，同時(shí)繪出樣本整體的“總”直方圖）

二變量圖：

graph twoway lfit price weight || scatter price weight

（作出price和weight的回歸線(xiàn)圖——“l(fā)fit”，然后與price和weight的散點(diǎn)圖相疊加）

twoway scatter price weight,mlabel(make)

（做price和weight的散點(diǎn)圖，并在每個(gè)點(diǎn)上標(biāo)注“make”，即廠商的取值）

twoway scatter price weight || lfit price weight,by(foreign)

（按照變量foreign的分類(lèi)，分別對(duì)不同類(lèi)樣本的price和weight做散點(diǎn)圖和回歸線(xiàn)圖的疊加，兩圖呈左右分布）

twoway scatter price weight || lfit price weight,by(foreign,col(1))

（按照變量foreign的分類(lèi)，分別對(duì)不同類(lèi)樣本的price和weight做散點(diǎn)圖和回歸線(xiàn)圖的疊加，兩圖呈上下分布）

twoway scatter price weight [fweight= displacement],msymbol(oh)

（畫(huà)出price和weight的散點(diǎn)圖，“msybol(oh)”表示每個(gè)點(diǎn)均為中空的圓圈，[fweight= displacement]表示每個(gè)點(diǎn)的大小與displacement的取值大小成比例）

twoway connected y1 time,yaxis(1) || y2 time,yaxis(2)

（畫(huà)出y1和y2這兩個(gè)變量的時(shí)間點(diǎn)線(xiàn)圖，并將它們疊加在一個(gè)圖中，左邊“yaxis(1)”為y1的度量，右邊“yaxis(2)”為y2的）

twoway line y1 time,yaxis(1) || y2 time,yaxis(2)

（與上圖基本相同，就是沒(méi)有點(diǎn)，只顯示曲線(xiàn)）

graph twoway scatter var1 var4 || scatter var2 var4 || scatter var3 var4

（做三個(gè)點(diǎn)圖的疊加）

graph twoway line var1 var4 || line var2 var4 || line var3 var4

（做三個(gè)線(xiàn)圖的疊加）

graph twoway connected var1 var4 || connected var2 var4 || connected var3 var4

（疊加三個(gè)點(diǎn)線(xiàn)相連圖）

更多變量：

graph matrix a b c y

（畫(huà)出一個(gè)散點(diǎn)圖矩陣，顯示各變量之間所有可能的兩兩相互散點(diǎn)圖）

graph matrix a b c d,half

（生成散點(diǎn)圖矩陣，只顯示下半部分的三角形區(qū)域）

用auto數(shù)據(jù)集：

graph matrix price mpg weight length,half by( foreign,total col(1) )

（根據(jù)foreign變量的不同類(lèi)型繪制price等四個(gè)變量的散點(diǎn)圖矩陣，要求繪出總圖，并上下排列】=具）

其他圖形：

graph box y,over(x) yline(.22)

（對(duì)應(yīng)x的每一個(gè)取值構(gòu)建y的箱型圖，并在y軸的0.22處劃一條水平線(xiàn)）

graph bar (mean) y,over(x)

對(duì)應(yīng)x的每一個(gè)取值，顯示y的平均數(shù)的條形圖。括號(hào)中的“mean”也可換成median、sum、sd、p25、p75等

graph bar a1 a2,over(b) stack

（對(duì)應(yīng)在b的每一個(gè)取值，顯示a1和a2的條形圖，a1和a2是疊放成一根條形柱。若不寫(xiě)入“stack”，則a1和a2顯示為兩個(gè)并排的條形柱）

graph dot (median)y,over(x)

（畫(huà)點(diǎn)圖，沿著水平刻度，在x的每一個(gè)取值水平所對(duì)應(yīng)的y的中位數(shù)上打點(diǎn)）

qnorm x

（畫(huà)出一幅分位-正態(tài)標(biāo)繪圖）

rchart a1 a2 a2

（畫(huà)出質(zhì)量控制R圖，顯示a1到a3的取值范圍）

簡(jiǎn)單統(tǒng)計(jì)量的計(jì)算：

ameans x

（計(jì)算變量x的算術(shù)平均值、幾何平均值和簡(jiǎn)單調(diào)和平均值，均顯示樣本量和置信區(qū)間）

mean var1 [pweight = var2]

（求取分組數(shù)據(jù)的平均值和標(biāo)準(zhǔn)誤，var1為各組的賦值，var2為每組的頻數(shù)）

summarize y x1 x2,detail

（可以獲得各個(gè)變量的百分比數(shù)、最大最小值、樣本量、平均數(shù)、標(biāo)準(zhǔn)差、方差、峰度、偏度）

***注意***

stata中summarize所計(jì)算出來(lái)的峰度skewness和偏度kurtosis有問(wèn)題，與ECELL和SPSS有較大差異，建議不采用stata的結(jié)果。

summarize var1 [aweight = var2], detail

（求取分組數(shù)據(jù)的統(tǒng)計(jì)量，var1為各組的賦值，var2為每組的頻數(shù)）

tabstat X1,stats(mean n q max min sd var cv)

（計(jì)算變量X1的算術(shù)平均值、樣本量、四分位線(xiàn)、最大最小值、標(biāo)準(zhǔn)差、方差和變異系數(shù)）

概率分布的計(jì)算：

（1）貝努利概率分布測(cè)試：

webuse quick

bitest quick==0.3,detail

（假設(shè)每次得到成功案例‘1’的概率等于0.3，計(jì)算在變量quick所顯示的二項(xiàng)分布情況下，各種累計(jì)概率和單個(gè)概率是多少）

bitesti 10,3,0.5,detail

（計(jì)算當(dāng)每次成功的概率為0.5時(shí)，十次抽樣中抽到三次成功案例的概率：低于或高于三次成功的累計(jì)概率和恰好三次成功概率）

（2）泊松分布概率：

display poisson(7,6)

.44971106

（計(jì)算均值為7，成功案例小于等于6個(gè)的泊松概率）

display poissonp(7,6)

.14900278

（計(jì)算均值為7，成功案例恰好等于6個(gè)的泊松概率）

display poissontail(7,6)

.69929172

（計(jì)算均值為7，成功案例大于等于6個(gè)的泊松概率）

（3）超幾何分布概率：

display hypergeometricp(10,3,4,2)

（計(jì)算在樣本總量為10，成功案例為3的樣本總體中，不重置地抽取4個(gè)樣本，其中恰好有2個(gè)為成功案例的概率）

display hypergeometric(10,3,4,2)

.96666667

（計(jì)算在樣本總量為10，成功案例為3的樣本總體中，不重置地抽取4個(gè)樣本，其中有小于或等于2個(gè)為成功案例的概率）

檢驗(yàn)極端值的步驟：

常見(jiàn)命令：tabulate、stem、codebook、summarize、list、histogram、graph box、gragh matrix

step1.用codebook、summarize、histogram、graph boxs、graph matrix、stem看檢驗(yàn)數(shù)據(jù)的總體情況：

codebook y x1 x2

summarize y x1 x2,detail

histogram x1,norm（正態(tài)直方圖）

graph box x1（箱圖）

graph matrix y x1 x2,half（畫(huà)出各個(gè)變量的兩兩x-y圖）

stem x1（做x1的莖葉圖）

可以看出數(shù)據(jù)分布狀況，尤其是最大、最小值

step2.用tabulate、list細(xì)致尋找極端值

tabulate code if x1==極端值（作出x1等于極端值時(shí)code的頻數(shù)分布表，code表示地區(qū)、年份等序列變量，這樣便可找出那些地區(qū)的數(shù)值出現(xiàn)了錯(cuò)誤）

list code if x1==極端值（直接列出x1等于極端值時(shí)code的值，當(dāng)x1的錯(cuò)誤過(guò)多時(shí)，不建議使用該命令）

list in -20/l（l表示last one，-20表示倒數(shù)第20個(gè)樣本，該命令列出了從倒數(shù)第20個(gè)到倒數(shù)第一個(gè)樣本的各變量值）

step3.用replace命令替換極端值

replace x1=? if x1==極端值

去除極端值：

keep if y<1000

drop if y>1000

對(duì)數(shù)據(jù)排序：

sort x

gsort +x

（對(duì)數(shù)據(jù)按x進(jìn)行升序排列）

gsort -x

（對(duì)數(shù)據(jù)按x進(jìn)行降序排列）

gsort -x, generate(id) mfirst

（對(duì)數(shù)據(jù)按x進(jìn)行降序排列，缺失值排最前，生成反映位次的變量id）

對(duì)變量進(jìn)行排序：

order y x3 x1 x2

（將變量按照y、x3、x1、x2的順序排列）

生成新變量：

gen logx1=log(x1)（得出x1的對(duì)數(shù)）

gen x1`=exp(logx1)（將logx1反對(duì)數(shù)化）

gen r61_100=1 if rank>=61&rank<=100（若rank在61與100之間，則新變量r61_100的取值為1，其他為缺失值）

replace r61_100 if r61_100!=1（“!=”表示不等于，若r61_100取值不為1，則將r61_100替換為0，就是將上式中的缺失值替換為0）

gen abs(x)（取x的絕對(duì)值）

gen ceil(x)（取大于或等于x的最小整數(shù)）

gen trunc(x)（取x的整數(shù)部分）

gen round(x)（對(duì)x進(jìn)行四舍五入）

gen round(x,y)（以y為單位，對(duì)x進(jìn)行四舍五入）

gen sqrt(x)（取x的平方根）

gen mod(x,y)（取x/y的余數(shù)）

gen reldif(x,y)（取x與y的相對(duì)差異，即|x-y|/(|y|+1)）

gen logit(x)（取ln[x/(1-x)]）

gen x=autocode(x,n,xmin,xmax)（將x的值域，即xmax-xmin，分為等距的n份）

gen x=cond(x1>x2,x1,x2)（若x1>x2成立，則取x1，若x1>x2不成立，則取x2）

sort x

gen gx=group(n)（將經(jīng)過(guò)排序的變量x分為盡量等規(guī)模的n個(gè)組）

egen zx1=std(x1)（得出x1的標(biāo)準(zhǔn)值，就是用(x1-avgx1)/sdx1）

egen zx1=std(x1),m(0) s(1)（得出x1的標(biāo)準(zhǔn)分，標(biāo)準(zhǔn)分的平均值為0，標(biāo)準(zhǔn)差為1）

egen sdx1=sd(x1)（得出x1的標(biāo)準(zhǔn)差）

egen meanx1=mean(x1)（得出x1的平均值）

egen maxx1=max(x1)（最大值）

egen minx1=min(x1)（最小值）

egen medx1=med(x1)（中數(shù)）

egen modex1=mode(x1)（眾數(shù)）

egen totalx1=total(x1)（得出x1的總數(shù)）

egen rowsd=sd(x1 x2 x3)（得出x1、x2和x3聯(lián)合的標(biāo)準(zhǔn)差）

egen rowmean=mean(x1 x2 x3)（得出x1、x2和x3聯(lián)合的平均值）

egen rowmax=max(x1 x2 x3)（聯(lián)合最大值）

egen rowmin=min(x1 x2 x3)（聯(lián)合最小值）

egen rowmed=med(x1 x2 x3)（聯(lián)合中數(shù)）

egen rowmode=mode(x1 x2 x3) （聯(lián)合眾數(shù)）

egen rowtotal=total(x1 x2 x3)（聯(lián)合總數(shù)）

egen xrank=rank(x)（在不改變變量x各個(gè)值排序的情況下，獲得反映x值大小排序的xrank）

數(shù)據(jù)計(jì)算器display命令：

display x[12]（顯示x的第十二個(gè)觀察值）

display chi2(n,x)（自由度為n的累計(jì)卡方分布）

display chi2tail(n,x)（自由度為n的反向累計(jì)卡方分布，chi2tail(n,x)=1-chi2(n,x)）

display invchi2(n,p)（卡方分布的逆運(yùn)算，若chi2(n,x)=p，那么invchi2(n,p)=x）

display invchi2tail(n,p)（chi2tail的逆運(yùn)算）

display F(n1,n2,f)（分子、分母自由度分別為n1和n2的累計(jì)F分布）

display Ftail(n1,n2,f)（分子、分母自由度分別為n1和n2的反向累計(jì)F分布）

display invF(n1,n2,P)（F分布的逆運(yùn)算，若F(n1,n2,f)=p，那么invF(n1,n2,p)=f）

display invFtail(n1,n2,p)（Ftail的逆運(yùn)算）

display tden(n,t)（自由度為n的t分布）

display ttail(n,t)（自由度為n的反向累計(jì)t分布）

display invttail(n,p)（ttail的逆運(yùn)算）

給數(shù)據(jù)庫(kù)和變量做標(biāo)記：

label data "~~~"（對(duì)現(xiàn)用的數(shù)據(jù)庫(kù)做標(biāo)記，"~~~"就是標(biāo)記，可自行填寫(xiě)）

label variable x "~~~"（對(duì)變量x做標(biāo)記）

label values x label1（賦予變量x一組標(biāo)簽:label1）

label define label1 1 "a1" 2 "a2"（定義標(biāo)簽的具體內(nèi)容：當(dāng)x=1時(shí)，標(biāo)記為a1，當(dāng)x=2時(shí)，標(biāo)記為a2）

頻數(shù)表：

tabulate x1,sort

tab1 x1-x7,sort（做x1到x7的頻數(shù)表，并按照頻數(shù)以降序顯示行）

table c1,c（n x1 mean x1 sd x1）（在分類(lèi)變量c1的不同水平上列出x1的樣本量和平均值）

二維交互表：

auto數(shù)據(jù)庫(kù)：

table rep78 foreign, c(n mpg mean mpg sd mpg median mpg) center row col

（rep78，foreign均為分類(lèi)變量，rep78為行變量，foreign為列變量，center表示結(jié)果顯示在單元格中間，row表示計(jì)算行變量整體的統(tǒng)計(jì)量，col表示計(jì)算列變量整體的統(tǒng)計(jì)量）

tabulate x1 x2,all

（做x1和x2的二維交互表，要求顯示獨(dú)立性檢驗(yàn)chi2、似然比卡方獨(dú)立性檢驗(yàn)lrchi2、對(duì)定序變量適用的等級(jí)相關(guān)系數(shù)gamma和taub、以及對(duì)名義變量適用的V）

tabulate x1 x2,column chi2（做x1和x2的二維交互表，要求顯示列百分比和行變量和列變量的獨(dú)立性檢驗(yàn)——零假設(shè)為變量之間獨(dú)立無(wú)統(tǒng)計(jì)關(guān)系）

tab2 x1-x7,all nofreq（對(duì)x1到x7這七個(gè)變量?jī)蓛傻刈龆S交互表，不顯示頻數(shù)：nofreq）

三維交互表：

by x3,sort:tabulate x1 x2,nofreq col chi2（同時(shí)進(jìn)行x3的每一個(gè)取值內(nèi)的x1和x2的二維交互表，不顯示頻數(shù)、顯示列百分比和獨(dú)立性檢驗(yàn)）

四維交互表：

table x1 x2 x3,c(ferq mean x1 mean x2 mean x3) by(x4)

tabstat X1 X2,by(X3) stats(mean n q max min sd var cv) col(stats)

tabstat X1 X2,by(X3) stats(mean range q sd var cv p5 p95 median),[aw=X4]（以X4為權(quán)重求X1、X2的均值，標(biāo)準(zhǔn)差、方差等）

ttest X1=1

count if X1==0

count if X1>=0

gen X2=1 if X1>=0

corr x1 x2 x3（做x1、x2、x3的相關(guān)系數(shù)表）

swilk x1 x2 x3（用Shapiro-Wilk W test對(duì)x1、x2、x3進(jìn)行正太性分析）

sktest x1 x2 x3（對(duì)x1、x2、x3進(jìn)行正太性分析，可以求出峰度和偏度）

ttest x1=x2（對(duì)x1、x2的均值是否相等進(jìn)行T檢驗(yàn)）

ttest x1,by(x2) unequal（按x2的分組方式對(duì)x1進(jìn)行T檢驗(yàn)，假設(shè)方差不齊性）

sdtest x1=x2（方差齊性檢驗(yàn)）

sdtest x1，by(x2)（按x2的分組方式對(duì)x1進(jìn)行方差齊性檢驗(yàn)）

聚類(lèi)分析：

cluster kmeans y x1 x2 x3, k(3)

——依據(jù)y、x1、x2、x3，將樣本分為n類(lèi)，聚類(lèi)的核為隨機(jī)選取

cluster kmeans y x1 x2 x3, k(3) measure(L1) start(everykth)

—— "start"用于確定聚類(lèi)的核，"everykth"表示將通過(guò)構(gòu)造三組樣本獲得聚類(lèi)核：構(gòu)造方法為將樣本id為1、1+3、1+3×2、 1+3×3……分為一組、將樣本id為2、2+3、2+3×2、2+3×3……分為第二組，以此類(lèi)推，將這三組的均值作為聚類(lèi)的核；"measure"用于計(jì)算相似性和相異性的方法，"L1"表示采用歐式距離的絕對(duì)值，也直接可采用歐式距離（L2）和歐式距離的平方（L2squared）。PS：這個(gè)方法所得的結(jié)果與SPSS所得結(jié)果相同。

sort c1 c2（對(duì)c1和c2兩個(gè)分類(lèi)變量排序）

by c1 c2：reg y x1 x2 x3（在c1、c2的各個(gè)水平上分別進(jìn)行回歸）

bysort c1 c2：reg y x1 x2 x3 if c3=1（逗號(hào)前面相當(dāng)于將上面兩步驟合一，既排序又回歸，逗號(hào)后面的“if c3=1”表示只有在c3=1的情況下才進(jìn)行回歸）

stepwise, pr(.2): reg y x1 x2 x3(使用Backward selection，去除P值大于0.2時(shí)變量)

stepwise, pe(.2): reg y x1 x2 x3(使用forward selection，去除P值小于0.2時(shí)變量)

stepwise, pr(.2) pe(.01):reg y x1 x2 x3（使用backward-stepwise selection，取P值在0.01和0.2之間的變量）

stepwise, pe(.2) forward: reg y x1 x2 x3（使用forward-stepwise selection）

reg y x1 x2 x3

predict Yhat,xb

predict u,resid

predict ustd,stdr（獲得殘差的標(biāo)準(zhǔn)誤）

predict std,stdp（獲得y估計(jì)值的標(biāo)準(zhǔn)誤）

predict stdf,stdf（獲得y預(yù)測(cè)值的標(biāo)準(zhǔn)誤）

predict e,e(1,12)（獲得y在1到12之間的估計(jì)值）

predict p,pr(1，12)（獲得y在1到12之間的概率）

predict rstu,rstudent（獲得student的t值）

predict lerg,leverage（獲得杠桿值）

predict ckd,cooksd（獲得cooksd）

reg y x1 x2 x3 c1 c2

adjust x1 x2 x3，se（使得變量x1、x2和x3等于其均值，求y的預(yù)測(cè)值和標(biāo)準(zhǔn)誤）

adjust x1 x2 x3，stdf ci（使得變量x1、x2和x3等于其均值，求y的預(yù)測(cè)值，預(yù)測(cè)標(biāo)準(zhǔn)誤和置信區(qū)間）

adjust x1 x2,by(c1) se ci（控制變量x1、x2，亦即取它們的均值，在分類(lèi)變量c1的不同水平上求y預(yù)測(cè)值，標(biāo)準(zhǔn)誤和置信區(qū)間）

adjust x1 x2 x3,by(c1) stdf ci（控制變量x1、x2、x3，亦即取它們的均值，在分類(lèi)變量c1的不同水平上求y預(yù)測(cè)值，預(yù)測(cè)標(biāo)準(zhǔn)誤和置信區(qū)間）

adjust x1 x2,by(c1 c2) se ci（控制變量x1、x2，在分類(lèi)變量c1、c2的不同水平上求y的預(yù)測(cè)值，標(biāo)準(zhǔn)誤和置信區(qū)間）

adjust x1 x2 x3,by(c1 c2) stdf ci（控制變量x1、x2、x3，在分類(lèi)變量c1、c2的不同水平上求y的預(yù)測(cè)值，預(yù)測(cè)標(biāo)準(zhǔn)誤和置信區(qū)間）

adjust x1=a x2=b x3=c，se ci（當(dāng)x1=a、x2=b、x3=c時(shí)，求y的預(yù)測(cè)值、標(biāo)準(zhǔn)誤和置信區(qū)間）

adjust x1=a x2=b x3=c，by(c1) se ci（當(dāng)x1=a、x2=b、x3=c時(shí)，在分類(lèi)變量c1的不同水平上，求y的預(yù)測(cè)值、標(biāo)準(zhǔn)誤和置信區(qū)間）

adjust x1=a x2=b c1=1，by(c1) se ci（當(dāng)x1=a、x2=b，并假設(shè)所有的樣本均為c1=1，求在分類(lèi)變量c1的不同水平上，因?yàn)樽兞縳3的均值不同，而導(dǎo)致的y的不同的預(yù)測(cè)值……）

mvreg Y1 Y2 ……: X1 X2 X3……（多元回歸）

mvreg y1 y2 y3: x1 x3 x3（多元回歸分析，y1 y2 y3為因變量，x1 x3 x3為自變量）

以下命令只有在進(jìn)行了mvreg之后才能進(jìn)行

test [y1]（測(cè)試對(duì)y1的回歸系數(shù)聯(lián)合為0）

test [y1]: x1 x2（測(cè)試對(duì)y1的回歸中x1、x2的系數(shù)為0）

test x1 x2 x3（測(cè)試在所有的回歸中，x1、x2、x3的系數(shù)均為0）

test [y1=y2]（對(duì)y1的回歸和對(duì)y2的回歸系數(shù)相等）

test [y1=y2]: x1 x2 x3, mtest（對(duì)y1和y2的回歸中，分別測(cè)試x1、x2、x3的系數(shù)是否相等，若沒(méi)有mtest這個(gè)命令，則測(cè)試他們的聯(lián)和統(tǒng)計(jì)）

test [y1=y2=y3]（三個(gè)回歸的系數(shù)是否相等，可加mtest以分別測(cè)試）

test [y1=y2=y3]: x1 x2 （測(cè)試三個(gè)回歸中的x1、x2是否相等，可加mtest）

est命令的用法：

（1）儲(chǔ)存回歸結(jié)果：

reg y x1 x2 x3（不限于reg，也可儲(chǔ)存ivreg、mvreg、reg3）

est store A

（2）重現(xiàn)回歸結(jié)果：

est replay A

（3）對(duì)回歸結(jié)果進(jìn)行進(jìn)一步分析

est for A:sum（對(duì)A回歸結(jié)果中的各個(gè)變量運(yùn)行sum命令）

異方差問(wèn)題：

獲得穩(wěn)健性標(biāo)準(zhǔn)誤

reg y x1 x2 x3 if c1==1（當(dāng)分類(lèi)變量c1=1時(shí)，進(jìn)行y和諸x的回歸）

reg y x1 x2 x3,robust（回歸后顯示各個(gè)自變量的異方差-穩(wěn)健性標(biāo)準(zhǔn)誤）

estat vif（回歸之后獲得VIF）

estat hettest,mtest（異方差檢驗(yàn)）

異方差檢驗(yàn)的套路：

（1）Breusch-pagan法：

reg y x1 x2 x3

predict u,resid

gen usq=u^2

reg usq x1 x2 x3

求F值

display R/(1-R)*n2/n1（n1表示分子除數(shù)，n2表示分母除數(shù)）

display Ftail(……)

求LM值

display R*n（n表示總樣本量）

display chi2tail(……)

（2）white法：

reg y x1 x2 x3

predict u,resid

gen usq=u^2

predict y

gen ysq=y^2

reg usq y ysq

求F值

display R/(1-R)*n2/n1（n1表示分子除數(shù)，n2表示分母除數(shù)）

display Ftail(……)

求LM值

display R*n（n表示總樣本量）

display chi2tail(……)

（3）必要補(bǔ)充

F值和LM值轉(zhuǎn)換為P值的命令：

display Ftail(n1,n2,a)（利用F值求p值，n1表示分子除數(shù)，n2表示分母除數(shù)，a為F值）

display chi2tail(n3,b)（利用LM值求p值，n3表示自由度的損失量，一般等于n1，b為L(zhǎng)M值）

異方差的糾正——WLS（weighted least square estimator）

（1）基本思路：

reg y x1 x2 x3 [aw=x1]（將x1作為異方差的來(lái)源，對(duì)方程進(jìn)行修正）

上式相當(dāng)于：

reg y/(x1^0.5) 1/(x1^0.5) x1/(x1^0.5) x2/(x1^0.5) x3/(x1^0.5),noconstant

（2）糾正異方差的常用套路（構(gòu)造h值）

reg y x1 x2 x3

predict u,resid

gen usq=u^2

gen logusq=log(usq)

reg logusq x1 x2 x3

predict g

gen h=exp(g)

reg y x1 x2 x3 [aw=1/h]

異方差hausman檢驗(yàn)：

reg y x1 x2 x3

est store A（將上述回歸結(jié)果儲(chǔ)存到A中）

reg y x1 x2 x3 [aw=1/h]

est store B

hausman A B

當(dāng)因變量為對(duì)數(shù)形式時(shí)（log(y)）如何預(yù)測(cè)y

reg logy x1 x2 x3

predict k

gen m=exp(k)

reg y m,noconstant

m的系數(shù)為i

y的預(yù)測(cè)值=i×exp(k)

方差分析：

一元方差分析

anova y g1 / g1|g2 /（g*表示不同分類(lèi)變量，計(jì)算g1和交互項(xiàng)/ g1|g2 /這兩種分類(lèi)的y值是否存在組內(nèi)差異）

anova y d1 d2 d1*d2（d*表示虛擬變量，計(jì)算d1、d2和d1*d2的這三種分類(lèi)的y值是否有組內(nèi)差異）

anova y d1 d2 x1 d2*x1, continuous(x1)（x*表示連續(xù)的控制變量）

多元方差分析

webuse jaw

manova y1 y2 y3 = gender fracture gender*fracture（按性別、是否骨折及二者的交互項(xiàng)對(duì)y1、y2和y3進(jìn)行方差分析）

manova y1 = gender fracture gender*fracture（相當(dāng)于一元方差分析，以y1為因變量）

————————————

webuse nobetween

gen mycons = 1

manova test1 test2 test3 = mycons, noconstant

mat c = (1,0,-1 \\ 0,1,-1)

manovatest mycons, ytransform(c)

進(jìn)行多元回歸的方法：

多元回歸分析：（與mvreg相同）

foreach vname in y1 y2 y3 { （確定y變量組vname）

reg `vname' x1 x2 x3 （將y變量組中的各個(gè)變量與諸x變量進(jìn)行回歸分析，注意vname的標(biāo)點(diǎn)符號(hào)）

}

上式等價(jià)于：

mvreg y1 y2 y3 = x1 x2 x3

reg3命令：

（1）簡(jiǎn)單用法：

reg3 (y1 = x1 x2 x3) (y2 = x1 x3 x4) (y3 = x1 x2 x5)

測(cè)試y1 coefs = 0

test [y1]

測(cè)試不同回歸中相同變量的系數(shù)：

test [y1=y2=y3], common

test ([y1=y2]) ([y1=y3]), common constant（constant表示包含截距項(xiàng)）

（2）用reg3進(jìn)行2SLS

reg3 (y1 = y2 x1 x2) (y2 = y1 x4),2sls

（2）用reg3進(jìn)行OLS

reg3 (y1 = y2 x1 x2) (y2 = y1 x4),ols

對(duì)兩個(gè)回歸結(jié)果進(jìn)行hausman檢驗(yàn)：

reg3 (y1=x1 x2 x3)(y2=y1 x4),2sls

est store twosls

reg3 (y1=x1 x2 x3)(y2=y1 x4),ols

est store ols

hausman twosls ols,equations(1:1)（對(duì)兩次回歸中的方程1，即“y1=x1 x2 x3”進(jìn)行hausman檢驗(yàn)）

hausman twosls ols,equations(2:2)（對(duì)兩次回歸中的方程2，即“y2=y1 x4”進(jìn)行hausman檢驗(yàn)）

hausman twosls ols,alleqs（對(duì)所有方程一起進(jìn)行檢驗(yàn)）

檢驗(yàn)忽略變量（模型的RESET）：

reg y x1 x2 x3

estat ovtest

滯后變量的制取

對(duì)變量y滯后一期：

gen y_l1=y[_n-1]

滯后兩期：

gen y_l2=y[_n-2]

以此類(lèi)推。

制取樣本序號(hào)：

gen id=_n

獲得樣本總量：

gen id=_N

時(shí)間序列回歸：

回歸元嚴(yán)格外生時(shí)AR(1)序列相關(guān)的檢驗(yàn)

reg y x1 x2

predict u,resid

gen u_1=u[_n-1]

reg u u_1,noconstant

回歸之后，u_1的序數(shù)如果不異于零，則該序列不相關(guān)

用Durbin-Watson Statistics檢驗(yàn)序列相關(guān)：

tsset year @（對(duì)時(shí)間序列回歸中代表時(shí)間的變量進(jìn)行定義）@

reg y x1 x2

dwstat @（求出時(shí)間序列回歸的DW值）@

durbina @（對(duì)該回歸是否具有序列相關(guān)進(jìn)行檢驗(yàn)，H0為無(wú)序列相關(guān)，可根據(jù)chi2值求出P值）@

durbina,small @（small可以根據(jù)F值求出P值，以代替chi2值）@

durbina,force @（讓檢驗(yàn)?zāi)茉趓obust、neway之后進(jìn)行）@

durbina,small lag(1/10) @（lag可以求出更高階滯后的序列相關(guān)，如本例中可求出1到10階的序列相關(guān)）@

durbina,robust lag(1/10) @（robust可進(jìn)行異方差—穩(wěn)健性回歸，避免未知形式的異方差）@

bgodfrey @（利用Breusch-Godfrey test求出高階序列相關(guān)）@

bgodfrey,small lag(1/10)

數(shù)據(jù)調(diào)查：survey data

源數(shù)據(jù)：dataset文件夾中的svydata

步驟：

1、定義survey data

svyset psuid [pweight=finalwgt], strata(stratid)

——定義primary sampling unit為psuid?？赡苁菧y(cè)試的編號(hào)，1or2

——定義pweight為finalwgt

——定義stratum identifer為stratid?？赡苁菧y(cè)試中被試的編號(hào)，1to31

2、生成male

gen male= (sex==1) if !missing(sex)

——當(dāng)sex不缺失且等于1時(shí)，male=sex

3、生成行變量為highbp，列變量為sizplace的表格

svy, subpop(male): tabulate highbp sizplace, col obs pearson lr null wald

——subpop規(guī)定了以male為數(shù)據(jù)調(diào)查的范圍

——tabulate highbp sizplace表示繪制行變量為highbp，列變量為sizplace的表格

——col表示每一列的加總為100%，row表示每一行的加總為100%，cell表示橫縱所有單元格的加總為100%

——obs表示列出每個(gè)單元格的樣本量，se表示列出每個(gè)單元格的標(biāo)準(zhǔn)誤，ci表示列出每個(gè)單元格的置信區(qū)間

——pearson表示求取pearson's chi-squired,皮爾遜的卡方檢定

——lr表示求取likelihood ratio

——null表示求取null-based statistics

——wald表示求取adjusted wald，llwald表示求取adjusted log-linear Wald，noadjust表示求取unadjusted Wald statistics

4、svy:mean x1 x2 x3

——對(duì)x1、x2、x3求取mean、se和ci

5、簡(jiǎn)單的tabulate twoway（不用svyset就可執(zhí)行）

tab2 y x,col chi2 exact lr

——col、cell、row等均可換用，chi2指的是Pearson's chi-squared、exact指的是fisher exact test、lr指的是likelihood-ratio chi-squared

6、svy的其他用法：

svy:reg y x

建立人工數(shù)據(jù)集：

創(chuàng)建一個(gè)包含從獨(dú)立標(biāo)準(zhǔn)正態(tài)分布中抽取的2000個(gè)觀察案例和三個(gè)隨機(jī)Z1、Z2、Z3，并分別定義他們的平均值和標(biāo)準(zhǔn)差。

matrix m=(0,2,3) ——定義三個(gè)變量的平均值

matrix sd=(1,.5,2) ——定義三個(gè)變量的標(biāo)準(zhǔn)差

drawnorm z1 z2 z3,n(2000) means(m) sds(sd) ——?jiǎng)?chuàng)建樣本量為2000，均值和標(biāo)準(zhǔn)差符合上面定義的數(shù)據(jù)集

補(bǔ)充：除了定義均值和標(biāo)準(zhǔn)差之外，還可定義相關(guān)矩陣和協(xié)方差矩陣等。

logit回歸

logit y x1 x2 x3

——y必須為二分變量

glogit outcomedata populationdata x1 x2 x3

——outcomedata為目標(biāo)樣本總量，populationdata為觀測(cè)樣本總量，outcomedata/populationdata的值便是一個(gè)概率，相當(dāng)于logit命令中的y

面板數(shù)據(jù)（Panel Data）

1、基本套路：

xtreg y x1 x2,re

est store re

xtreg y x1 x2,fe

est store fe

hausman re fe

——如果hausman檢驗(yàn)的結(jié)果為顯著，則采用固定效應(yīng)（fe）模型，不顯著，則選取隨機(jī)效應(yīng)（re）模型

2、隨機(jī)效應(yīng)的檢驗(yàn)：

xtreg y x1 x2,re

xttest0

xttest1

——xttest1是xttest0的擴(kuò)展，若這xttest0的結(jié)果為顯著，則采用隨機(jī)效應(yīng)（re）模型

xttest1的假設(shè)是沒(méi)有隨機(jī)效應(yīng)和/或沒(méi)有序列相關(guān)，它的七個(gè)結(jié)果分別表示：

1) LM Test for random effects, assuming no serial correlation

（假設(shè)沒(méi)有序列相關(guān)情況下對(duì)隨機(jī)效應(yīng)進(jìn)行LM檢驗(yàn)）

2) Adjusted LM test for random effects, which works even under serial

correlation

（假設(shè)有序列相關(guān)的情況下對(duì)隨機(jī)LM檢驗(yàn)）

3) One sided version of the LM test for random effects

（假設(shè)沒(méi)有序列相關(guān)的情況下對(duì)隨機(jī)效應(yīng)進(jìn)行單邊檢驗(yàn)）

4) One sided version of the adjusted LM test for random effects

（假設(shè)有序列相關(guān)的情況下對(duì)隨機(jī)效應(yīng)進(jìn)行單邊檢驗(yàn)）

5) LM test for first-order serial correlation, assuming no random effects

（假設(shè)沒(méi)有隨機(jī)效應(yīng)的情況下對(duì)一階序列相關(guān)進(jìn)行檢驗(yàn)）

6) Adjusted test for first-order serial correlation, which works even under

random effects

（假設(shè)有隨機(jī)效應(yīng)的情況下對(duì)一階序列相關(guān)進(jìn)行檢驗(yàn)）

7) LM Joint test for random effects and serial correlation

（隨機(jī)效應(yīng)和序列相關(guān)的聯(lián)合檢驗(yàn)）

3、固定效應(yīng)模型，可采用廣義最小二乘法（gls）進(jìn)行估算，也可采用固定效應(yīng)方程（fe）：

xtserial y x1 x2

xtgls y x1 x2

xttest2

xttest3

——xtserial用于檢驗(yàn)固定效應(yīng)模型中的一階序列自相關(guān)，可通用于xtgls和fe之前

——xttest2用于檢驗(yàn)不同廠商的相似性，若顯著則各廠家的截面相似，可通用于xtgls和fe之后

——xttest3用于檢驗(yàn)固定效應(yīng)模型中的異方差問(wèn)題，若顯著則有異方差，可通用于xtgls和fe之后

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

STATA常用命令1

STATA常用命令1

調(diào)整變量格式：

合并數(shù)據(jù)：

對(duì)樣本進(jìn)行隨機(jī)篩選：

查看與編輯數(shù)據(jù)：

數(shù)據(jù)合并（merge）與擴(kuò)展（append）

莖葉圖：

直方圖

二變量圖：

其他圖形：

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

STATA常用命令1

調(diào)整變量格式：

合并數(shù)據(jù)：

對(duì)樣本進(jìn)行隨機(jī)篩選：

查看與編輯數(shù)據(jù)：

數(shù)據(jù)合并（merge）與擴(kuò)展（append）

莖葉圖：

直方圖

二變量圖：

其他圖形：

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av