当前位置:文档之家› Stata学习笔记

Stata学习笔记

Finditsummarize,net寻找网络帮助 summarize为需要获取帮助对象
Search summarize ,net 寻找网络帮助 summarize为需要获取帮助对象
显示结果
Display 5+9
描述统计(summarize 可简写成sum)
Use atuo,clear
Summarize price 描述price的观察值个数、平均值、标准差、最小值、最大值
以下命令均采用小写字母
Chapter 1 stata入门
打开数据
use "D:\Stata9\", clear用use命令打开数据
sysuse auto,clear auto 为系统数据 sysuse为打开系统数据的命令
获取帮助
Help summarizesummarize为需要获取帮助对象 可以改为其他的需要帮助的对象
据便被复制到STATA中,退出数据编辑器
sumscoresumscore[weight=num]/*加权计算,比较该结果与sum score的区别,
实际上,不用权重选项时,相当于权重相等。*/
. sumscore[w=n]sumscore, detail
. sumscore, d cdd:/stata9
a float %9.0g
Sorted by:
Note: dataset has changed since last saved
. compressdreplacea=101/*注意a的storage type现在自动升为int型,
因为byte最大只能为100*/
a was byte now int
行操作,等价于后面加上代表所有变量的_all。*/
. summarize _all/注意到该命令输出结果与上一个命令完全一样
. sumsusu是summarize的最简化略写,不能再简化为s
. scdd:/stata9
. useauto, clear
. sumpricesupsutsum tr tucdd:/stata9
file not foundsysuseauto,clear3.1.2usenlswork, clear
file not found
此时,如果确定该数据为示例数据,可以直接通过网络获取,其命令为:
. usewebusenlswork, clear另一个网络数据较多的地方是波士登大学的数据中心,伍德里奇的《计量经
. listprice npricecdd:/stata9
. useauto,clear
. listmake priceifforeign==0
*只查看价格超过1万元的进口车(同时满足两个条件),则
. listmake priceifforeign==1 & price>10000
*查看价格超过1万元或者进口车(两个条件任满足一个)
Cd d:\stata d:\stata为路径
如果想知道当前路径下有哪些文件,可以用dir命令来列示
.dir
假设你想在D盘的根目录下创建一个新的文件夹mydata来存放数据文件,
命令为mkdir。
mkdird:\mydata
错误提示
List myvar
上述命令试图显示变量myvar,但是结果窗口仅出现如下的显示
variable myvar not found
r(111);
红色信息表明,没有找到一个叫myvar的变量,的确,我们的数据中并没有
这个变量。List巧妇难为无米之炊。
红色信息下面还有一个天兰色的r(111),用鼠标点击,即可弹进一个帮助信
息框,给出错误的更详尽解释。
再比如,我们在求五数概略时,误把sum写成了sun
foreign的排序,所以出现了错误提示。更正的办法是:*/
. sortforeignbyforeign: sumprice weight
*更简略的方式是把两个命令用一个组合命令来写。
. byforeign, sort: sumprice weight
如果不想从小到大排序,而是从大到小排序,其命令为gsort。
属性信息,注意观察显示结果中,a的storage type为float型,
浮点型为默认类型*/
Contains data
obs: 1
vars: 1
size: 8 % of memory free)
storage display value
variable name type format label variable label
例:生成一个新的价格变量nprice,该变量的取值为原汽车价格变量price的基础上涨10元
. cdd:/stata9
. useauto, clear
. gennprice=price+10listprice npricereplacenprice=nprice-10/*命令replace则直接改变原变量的赋值,nprice调减后与price变量取值相等*/
byte-127100+/-11
int-32,76732,740+/-12
long -2,147,483,6472,147,483,620+/-14
float *10^38*10^36+/-10^-364
double *10^307*10^307+/-10^-3238
当运算精度要求很高的时候,需要将变量设置成浮点型或双精度型。
和SPSS软件,此时需要用STATA提供的其他命令或者使用transfer数据格式转
化软件。在讨论其他输入或导入数据的方法之前,我们先来学习一点数据类型的
知识。
数据类型
STATA通常把变量划分为三类:分别是数值型,字符型和日期型
3.2.1数值变量:
用0、1、2…9及+、–(正负号)与小数点“(.)”来表示。在输入数据时,
. sumpricein1/10ifforeign==0
加权weight
[byvarlist:] command [varlist] [=exp] [ifexp] [inrange][weight][, options]
任务:下表是2005年湖北省高考640分及以上成绩一分一段的人数统计,第一
列score为高考分数,第二列num为该分数段的人数。现在我们要求640分及以
. useauto,clear
. listprice in 1/30, sep(10)listprice in 10/30, sep(2)listprice, nohead3.1.1ta,如果在STATA
软件当前路径下,直接用use命令即可打开;如果不在当前路径下,则可以使用
sysuse命令打开。
. useauto,clearcd d:/useauto, clear
. listmake priceifforeign==1 | price>10000
*分类型查看价格超过1万元的汽车的品牌和价格
. byforeign, sort: listmake priceifprice>10000
范围筛选in range
[byvarlist:] command [varlist] [=exp] [ifexp][inrange][weight] [, options]
Sum weight summarize可简写成sum
Sum weight price 同时完成上面两步
绘图
Scatter price weight scatter 为绘制散点图命令
Line price weight ,sort line 为绘制折线图命令,sort为排序,绘制折线图前需要先排序
生成新的数据(generate 可简写成gen)
济学导论》一书中所使用的全部数据都可以通过该数据中心获得。比如
. use即打开教材中例中所使用的CEO数据。
use命令只能打开后辍名为“*.dta”格式的数据,.dta格式以外的数据,STATA
不能直接读取,需要从外部读入,最简单而直接的办法是复制和粘贴。但是有时
没有其他软件,比如,我们有SAS格式或SPSS格式的数据,但没有SAS软件
Clear
Set obs 1000 设置观测值的组数
Gen x=_n _n 为观察值得序号
Gen y=x+100
控制结果输出显示
List n
设置屏幕滚动
Set more off 先设置此项 则显示时,屏幕不停止
Set more on 先设置此项 则显示时,会使显示停止
清除内存中原有内容
clear
设置文件存取路径(cd)
.n: sumprice weightsortpricebyforeign: sumprice weight
*not sorted
/*系统提示没有排序,这是因为by varlist在执行时要求内存中的数据是按照
by后面的变量排序的。当我们用sort price重新排序后,就打乱了原来按照
. sun
unrecognized command: sun
r(199);
显示说不认识sun这个命令。
附录:常见命令
Chapter2命令语句
掌握命令语句的格式
[byvarlist:] command [varlist] [=exp] [ifexp] [inrange] [weight] [, options]
另注意1和的精度是不同的,前者在,区间内近似,而后者在
,区间内近似。若多次运算反复取四舍五入,精度较低时将使
计算误差迅速变大,然而,精度高时占用的内存资源较多。下面的命令有助于理
解变量存贮类型变换。
. clear
相关主题