当前位置：文档之家› (完整)stata命令总结,推荐文档

(完整)stata命令总结,推荐文档

stata11 常用命令注：JB统计量对应的p大于0.05 ，则表明非正态，这点跟sktest 和swilk 检验刚好相反；dta 为数据文件；gph 为图文件；do 为程序文件；注意stata 要区别大小写；不得用作用户变量名：_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double float long int in if using with 命令：读入数据一种方式input x y142 5.53 6.247.758.5endsu/summarise/sum x 或su/summarise/sum x,d 对分组的描述：sort group by group:su x%%%%%tabstat economy,stats（max）%返回变量economy的最大值%%stats括号里可以是：mean，count（非缺失观测值个数），sum（总和），max，min，range ，%% sd ，var ，cv（变易系数＝标准差/ 均值），skewness，kurtosis ，median，p1（1 ％分位%% 数，类似地有p10, p25, p50, p75, p95, p99），iqr（interquantile range = p75 –p25）_all %描述全部_N 数据库中观察值的总个数。

_n 当前观察值的位置。

_pi 圆周率π 的数值。

list gen/generate % 产生数列egen wagemax=max（wage）clearuseby（分组变量）set more 1/0count % 计数 gsort +x ( 升序 ) gsort -x ( 降序 ) sort x 升序；并且其它变量顺序会跟着改变label var y " 消费 " %添加标签describe %描述数据文件的整体，包括观测总数，变量总数，生成日期，每个变量的存储类型 (storage type) ，标签 (label) replace x5=2*y if x!=3 % 替换变量值replace age = 25 in 107 %令第 107 个观测中 age 为 25rename y2 u %改变变量名drop in 2 %删除全部变量的第 2 行drop if x==. 删去 x 为缺失值的所有记录keep if x<2 %保留小于 2 的数据，其余变量跟随 x 改变 keep in 2/10 %保留第 2-10 个数 keep x1-x5 %保留数据库中介于 x1 和 x5 间的所有变量 ( 包括 x1 和 x5) ，其余变量删除ci x1 x2,by(group) %算出置信区间 , 不过先前对 group 要先排序，即 sort group ； %by 的意思逐个进行 cii 12 3.816667 0.2710343, level(90) %已知均值，方差，计算 90%的置信区间cii 10 2%obs=10,mean=2,以二项分布形式，计算置信区间centile x,centile(2.5 25 50 75 97.5) %取分位数correlate/corr x y z%相关系数pwcorr x y,sig %给出原假设 r=0 的命令%如果变量非服从正态分布，则 spearman x y regress/reg mean year % 回归方程建立 reg y x,noconstant % 无常数项 predict meanhat %预测拟合值predict e,residual % 得到残差 estat hettest % 异方差检验 dwstat % Durbin-Watson 自相关检验 vif % 方差膨胀因子取 0或 1，是被解释变量， x1-x3 是被解释变量 ) %logit取 0 或 1 ，是被解释变量， x1-x3 是被解释变量 ) %probit 取值在 0和 1之间，是被解释变量， x1-x3 是被解释变sktest e % 残差正态性检验 p>0.05 则接受原假设，即服从正态分布； %% sktest 是基于变量的偏度和斜度 (正态分布的偏度为 0，斜度为 3) swilk x %基于 Shapiro-Wilk 检验%%p 值越小，越倾向于拒绝零假设，也就是变量越有可能不服从正态分布 xi %生成虚拟变量tabulat gender,summ(math) %用 gender 指标对 math 进行分类，返回两类 mathlogit y x1 x2 x3 (y回归 probit y x1 x2 x3 (y 回归tobit y x1 x2 x3 (y 量 ) %tobit 回归的mean、std 、freqtabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为 3 tabulate 变量名[, generate( 新变量) missing nofreq nolabel plot ] %%%%%generate( 新变量) // 按分组变量产生哑变量nofreq // 不显示频数nolabel// 不显示数值标记plot // 显示各组频数图示missing // 包含缺失值cell // 显示各小组的构成比( 小组之和为1) column // 按栏显示各组之构成( 各栏总计为1) row // 按行显示各组之构成( 各行总计为1) %%%%% 求和，求最小？mod(x,y) % 求余数means %返回三种平均值di normprob(1.96) di invnorm(0.05) di binomial(20,5,0.5) di invbinomial(20,5,0.5) di tprob(10,2) di invt(10.0.05) di fprob(3,27,1) di invfprob(3,27,0.05) di chi2(3,5) di invchi2(3,0.05)stack x y z,into（e）%把三列合成一列xpose,clear %矩阵转置append using d:\0917.dta %把已打开的文件（x y z ）跟0917 里的（x y z ）合并，是竖向合并，即观察值合并；merge using D:\0917.dta %把已打开的文件（x y z ）跟0917 里的（ a b ）合并，是横向合并，即变量合并；format x %9.2e %科学记数format x %9.2f %2 位小数%产生随机数%1 产生20 个在（0 ，1）区间上均匀分布的随机数uniform（）set seed 100set obs 20gen r=uniform（）list%clear 清除内存set seed 200 设置种子数为200 set obs 20 设置样本量为20 range no 1 20gen r=uniform()gen group=1为1sort rreplace group=2 in 11/20建立编号 1 至20产生在(0,1) 均匀分布的随机数设置分组变量group 的初始值对随机数从小到大排序设置最大的10 个随机数所对应的记录为第 2 组，即：最小的10 个随机数所对应的记录为第 1 组sort no list 按照编号排序显示随机分组的结果也可以list if group==1 和list no if group==1%2 产生10 个服从正态分布N( 100，6^2)的随机数invnorm(uniform())*sigma+u clear清除内存set seed 200 set obs 10设置种子数为200设置样本量为10gen x=invnorm(uniform())*6+100 产生服从N(100 ，6^2) 的随机数list画图注意有些图前面要加histogram 直方图line 折线图scatter 散点图scatter y x,c(l) s(d) b2("(a)") graph twoway connected y x 连点图graph bar (sum) var2,over(var1) blabel(total) % 条形图. graph bar p52 p72,by(d) . graph bar p52 p72,over(d) . graph bar p52p72,by(d) stack . graph bar p52 p72,over(d) stack //////////// 数据如下%d p52 p72 %1 163.2 27.4 %2 72.5 83.6 %3 57.2 178.2 histogram x,bin(8) norm%画直方图，加正态分数线graph pie a b o ab if area==1,plabel(_all percent) % 画饼图graph pie var2, over(var1) plabel(_all percent) %饼图graph pie p52 p72,by(d) % 饼图 graph box y1 % 箱体图 qnorm x %qq 图 lfit y x %回归直线graph matrix gender economy math 多变量散点图line yhat x||scatter y x,c(.l) s(O.) xline(12) yline(5.4) %线形图 &散点图有一些通用的选项可以给图形“润色”：标题 title( “string ” ) ( string 可为任意的字符串，下同) 脚注 note( “string ”) 横座标标题xtitle( “string ”) 纵座标标题 ytitle( “sting ”) 横座标范围 xaxis(a,b) (a<b 为两个数字，下同) 纵座标范围 yaxis(a,b) 插入文字 text (该命令既要指定插入文字的内容，也要指定插入的位置) 插入图例 legend (该命令既要指定图例的内容，也要指定其位置) 绘制散点图和线条的两个主要的选择项为：// 连接各散点的方式， c 表示： . 不连接 ( 缺省值 ) l L m s J || [varname] 用变量的取值代码表示 [_n] 用点的记录号表示数学函数等都要与 generate 、 replace 、display 一起使用，不能单独使用程序文件 do use d:\0917.dta reg y xconnect(c...c) 或简写为 c(c...c)II 同 ||,个短横Symbol(s...s)// 表示各散点的图形， s 表示：或简写为 s(s...s) O 大圆圈 ( 缺省值 )S 大方块 T 大三角形 o 小圆圈 d 小菱形p 小加号用直线连接沿x 方向只向前不向后直线连接计算中位数并用直线连接用三次平滑曲线连接以阶梯式直线条连接用直线连接在同一纵向上的两点只是线的顶部和底部有一 i 小点无符号corr y xline y x,saving(d:\d4) 按ctrl+D 执行字符串操作函数：length(s)%长度函数，计算s 的长度, 如，disp length("ab") 的结果是substr(s,n1,n2)%子串函数，获得从s 的n1 个字符开始的n2个字符成的字符串,dispsubstr("abcdef",2,3)的结果是"bcd"string(n)%将数值n 转换成字符串函数，如，dispstring(41)+"f" 的结果是"41f"real(s)%将字符串s 转换成数值函数，如，dispreal("5.2")+1 的结果是6.2upper(s)%转换成大写字母函数，如，dispupper("this")的结果是"THIS"lower(s)%转换成小写字母函数，如displower("THIS")的结果是"this"index(s1,s2)%子串位置函数，计算s2 在s1 中第一次出现的起始位置, 如果s2 不在s1 中, 则结果为0。

e商务文档

(完整)stata命令总结,推荐文档

相关文档推荐：