当前位置:文档之家› stata常用命令

stata常用命令

面板数据估计首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company yeartsset industry year产生新的变量:gen newvar=human*lnrd产生滞后变量Gen fiscal(2)=L2.fiscal产生差分变量Gen fiscal(D)=D.fiscal描述性统计:xtdes :对Panel Data截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令:xtregxtreg depvar [varlist] [if exp] , model_type [level(#) ]Model type 模型be Between-effects estimatorfe Fixed-effects estimatorre GLS Random-effects estimatorpa GEE population-averaged estimatormle Maximum-likelihood Random-effects estimator主要估计方法:xtreg: Fixed-, between- and random-effects, and population-averaged linear modelsxtregar:Fixed- and random-effects linear models with an AR(1) disturbance xtpcse :OLS or Prais-Winsten models with panel-corrected standard errors xtrchh :Hildreth-Houck random coefficients modelsxtivreg :Instrumental variables and two-stage least squares for panel-data modelsxtabond:Arellano-Bond linear, dynamic panel data estimatorxttobit :Random-effects tobit modelsxtlogit : Fixed-effects, random-effects, population-averaged logit modelsxtprobit :Random-effects and population-averaged probit models xtfrontier :Stochastic frontier models for panel-dataxtrc gdp invest culture edu sci health social admin,betaxtreg命令的应用:声明面板数据类型:tsset sheng t描述性统计:xtsum gdp invest sci admin1.固定效应模型估计:xtreg gdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P 值2.随机效应模型估计:xtreg gdp invest culture sci health admin techno,re检验随机效应模型是否优于混合OLS 模型:在进行随机效应回归之后,使用xttest0检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型3. 最大似然估计Ml:xtreg gdp invest culture sci health admin techno,mleHausman检验Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果xtreg gdp invest culture sci health admin techno,feest store fe第二步:估计随机效应模型,存储结果xtreg gdp invest culture sci health admin techno,reest store re第三步:进行hausman检验hausman feHausman检验量为:H=(b-B)´[Var(b)-Var(B)]-1(b-B)~x2(k)Hausman统计量服从自由度为k的χ2分布。

当H大于一定显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型如果hausman检验值为负,说明的模型设定有问题,导致Hausman 检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等可以改用hausman检验的其他形式:hausman fe, sigmaless对于固定效应模型的异方差检验和序列相关检验:Xtserial gdp invest culture sci health admin techno异方差检验:xtreg gdp invest culture sci health admin techno,fexttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model)随机效应模型的序列相关检验:xtreg gdp invest culture sci health admin techno,reXttest1Xttest1用于检验随机效应(单尾和双尾) 、一阶序列相关以及两者的联合显著检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著可以使用广义线性模型xtgls对异方差和序列相关进行修正:xtgls gdp invest culture sci health admin techno, panels(hetero),修正异方差xtgls gdp invest culture sci health admin techno, panels(correlated),修正依横截面而变化的异方差xtgls gdp invest culture sci health admin techno, panels(hetero) corr(ar1),修正异方差和一阶序列相关ar(1)我常用到的stata命令最重要的两个命令莫过于help和 search了。

即使是经常使用stata的人也很难,也没必要记住常用命令的每一个细节,更不用说那些不常用到的了。

所以,在遇到困难又没有免费专家咨询时,使用stata自带的帮助文件就是最佳选择。

stata的帮助文件十分详尽,面面俱到,这既是好处也是麻烦。

当你看到长长的帮助文件时,是不是对迅速找到相关信息感到没有信心?闲话不说了。

help和search都是查找帮助文件的命令,它们之间的区别在于help 用于查找精确的命令名,而search是模糊查找。

如果你知道某个命令的名字,并且想知道它的具体使用方法,只须在stata的命令行窗口中输入help空格加上这个名字。

回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。

如果你想知道在stata下做某个估计或某种计算,而不知道具体该如何实现,就需要用 search命令了。

使用的方法和help类似,只须把准确的命令名改成某个关键词。

回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。

在列表中寻找最相关的内容,点击后在弹出的查看窗口中会给出相关的帮助文件。

耐心寻找,反复实验,通常可以较快地找到你需要的内容。

下面该正式处理数据了。

我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。

因为很少有一项实证研究能够一次完成,所以,当你下次继续工作时。

能够重复前面的工作是非常重要的。

有时因为一些细小的不同,你会发现无法复制原先的结果了。

这时如果有记录下以往工作的do文件将把你从地狱带到天堂。

因为你不必一遍又一遍地试图重现做过的工作。

在stata窗口上部的工具栏中有个孤立的小按钮,把鼠标放上去会出现“bring do-file editor to front”,点击它就会出现do文件编辑器。

为了使do文件能够顺利工作,一般需要编辑do文件的“头”和“尾”。

这里给出我使用的“头”和“尾”。

/*(标签。

简单记下文件的使命。

) */capture clear (清空内存中的数据)capture log close (关闭所有打开的日志文件)set mem 128m (设置用于stata使用的内存容量)set more off (关闭more选项。

如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。

你按空格键后再输出下一屏,直到全部输完。

如果关闭则中间不停,一次全部输出。

)set matsize 4000 (设置矩阵的最大阶数。

我用的是不是太大了?)cd D: (进入数据所在的盘符和文件夹。

和dos的命令行很相似。

)log using (文件名).log,replace (打开日志文件,并更新。

日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果。

)use (文件名),clear (打开数据文件。

)(文件内容)log close (关闭日志文件。

)exit,clear (退出并清空内存中的数据。

)这个do文件的“头尾”并非我的发明,而是从沈明高老师那里学到的。

版权归沈明高老师。

(待续)我常用到的stata命令:(续)实证工作中往往接触的是原始数据。

这些数据没有经过整理,有一些错漏和不统一的地方。

比如,对某个变量的缺失观察值,有时会用点,有时会用-9,-99等来表示。

回归时如果使用这些观察,往往得出非常错误的结果。

还有,在不同的数据文件中,相同变量有时使用的变量名不同,会给合并数据造成麻烦。

因此,拿到原始数据后,往往需要根据需要重新生成新的数据库,并且只使用这个新库处理数据。

这部分工作不难,但是非常基础。

因为如果在这里你不够小心,后面的事情往往会白做。

假设你清楚地知道所需的变量,现在要做的是检查数据、生成必要的数据并形成数据库供将来使用。

检查数据的重要命令包括codebook,su,ta,des 和list。

其中,codebook提供的信息最全面,缺点是不能使用if条件限制范围,所以,有时还要用别的帮帮忙。

su空格加变量名报告相应变量的非缺失的观察个数,均值,标准差,最小值和最大值。

相关主题