当前位置:
文档之家› stata初级入门2-数据篇
stata初级入门2-数据篇
decode命令:将数值变量转换为字符变量
包括数值数据的字符转换
destring命令: 将字符变量转换为数值变量
语法:destring [varlist], [generate (newvarlist) | replace] [options] options:ignore (“chars”) 删除字符变量中的非数 值字符,force将非数值字符转换为缺失值 语法:tostring varlist, [generate (newvarlist) | replace]
4
use 命令
ቤተ መጻሕፍቲ ባይዱ
语法格式: use filename [, clear nolabel],读取整个数据文 件 use [varlist] [if] [in] using filename [, clear nolabel],从数据文件中仅读取几个变量 范例:
use "C:\Program Files (x86)\Stata12\auto.dta", clear use "C:\Program Files (x86)\Stata12\auto.dta", clear nolabel use make price using "C:\Program Files (x86)\Stata12\auto.dta", clear
Bytes 1 2 . . . 244
数值变量和字符变量的转换
encode命令:将字符变量转换为数值变量。
格式:encode varname [if] [in], generate(newvar) [label (name) noextend] 菜单: Data > Create or change data > Other variabletransformation commands > Convert variables from string to numeric 范例:encode make, generate(make2) 格式:decode varname [if] [in], generate(newvar) [maxlength(#)] 菜单: Data > Create or change data > Other variabletransformation commands > Convert variables from numeric to string 范例:deocde price, genrate(price2)
《计量经济学软件应用》课程讲义 21
将变量的某些数值转化为缺失值,用mvdecode命令
2014年4月17日星期四
菜单操作: Data > Create or change data > Other variable-transformation commands > Change missing values to numeric或Change numeric values to missing
在search all中敲入搜索关键词:找到可能你需要的 程序包,而后安装即可。 这个方法安装的外挂命令,不会在菜单中出现,需 要你记住命令名。
《计量经济学软件应用》课程讲义 8
2014年4月17日星期四
二、数据的保存或导出
1保存用save/save as 2导出
从file菜单中export选项下选择你想保存的格式; 用outfile,outsheet,fdasave,xmlsave命令
1.变量属性,如名称、标签、值标签
变量名:由英文字符、数字、中文字符组成。
字母大小写表示的含义不同!!!
标签:对变量含义的解释
值标签:用于对分类变量值的含义进行解释
如foreign有domestic和foreign,在数据量化上,可用0代 表domestic,1代表foreign。
《计量经济学软件应用》课程讲义 11
. input x y x y 1. 1 2 2. 3 4 3. 5 6 4. 7 8 5. 9 10 6. end
3
2.数据文件的读取
(1)Stata数据文件,后缀.dta
直接双击 菜单操作:在工具栏上直接点击 Open:
或File >
2014年4月17日星期四
《计量经济学软件应用》课程讲义
Stata 入门2 ——数据篇
2014年4月17日星期四
《计量经济学软件应用》课程讲义
1
一、数据录入
直接录入 打开dta数据文件 导入其它格式的数据文件 其它方式
2014年4月17日星期四
《计量经济学软件应用》课程讲义
2
1直接录入
(1)直接在stata中录入(适用于小样 本少变量数据):打开程序,调用数据 编辑窗口,直接录入数据,如excel中操 作。
12
2014年4月17日星期四
《计量经济学软件应用》课程讲义
3.变量属性的修改
变量名更改:rename命令,常用语法格式:rename old_var new_var,如rename income inc. 变量标签(label)的定义:label命令,语法:label var varname “##”,如label var foreign “car type”。除用于定义变 量的标签外,其还可用于定义数据的标签,如label data “auto in American” 分类(或指示)变量的值标签定义:亦label命令,要完成分 类变量值的标签定义有两步,如把变量foreign取值为0,定义 为domestic,取值为1,定义为foreign,并用origin表示该变 量值标签定义结果:
2014年4月17日星期四
《计量经济学软件应用》课程讲义
18
菜单操作:
Data > Create or change data > Create new variable Data > Create or change data > Create new variable (extended)
Precision for float is 3.795x10^-8. Precision for double is 1.414x10^-16.
字符型数据
String storage type str1 str2 ... ... ... str244
Maximum length 1 2 . . . 244
2014年4月17日星期四
《计量经济学软件应用》课程讲义
9
三、数据操作
变量名、标签等属性 变量属性显示和修改 变量的数据类型和长度 变量生成和变量值修改 缺失值的处理 变量的剔除和保留 数据的排序 字符变量和数值变量的相互转换
《计量经济学软件应用》课程讲义 10
2014年4月17日星期四
label define origin 0 “domestic” 1 “foreign” label values foreign origin
2014年4月17日星期四
《计量经济学软件应用》课程讲义
13
4.变量的数据类型和长度
整数数值型:
(1)byte,(2)int,
(3)long。
格式:mvencode varlist [if] [in], mv(#|mvc=# [\ mvc=#...] [\ else=#]) [override] 范例: mvencode rep78 if foreign == 0, mv(998)
格式: mvdecode varlist [if] [in], mv(numlist | numlist=mvc [\ numlist=mvc...]) 范例: mvdecode rep78, mv(998=. \ 999=.a)
6.变量值的修改
replace命令 格式:replace oldvar=exp [if] [in] [, nopromote] 范例:如replace id=1
7.缺失值的处理
在现有的调查中,经常用88, 99,888,999,….等来表示不 知道或不清楚。 在stata中如何一般用”.”来表示该变量的观测缺失值。 将变量缺失值转化为数值,用mvencode命令
小数数值型:
(1)float,(2)double。
数值型数据一般定义为float型,除非你 有特别定义。 字符串型:string
2014年4月17日星期四 《计量经济学软件应用》课程讲义 14
数值型数据
Storage type byte int long float double Minimum -127 -32,767 -2,147,483,647 -1.70141173319*10^38 -8.9884656743*10^307 Maximum 100 32,740 2,147,483,620 1.70141173319*10^38 8.9884656743*10^307 Closest to 0 without being 0 +/-1 +/-1 +/-1 +/-10^-38 +/-10^-323 bytes 1 2 4 4 8
菜单操作:file>import
2014年4月17日星期四
《计量经济学软件应用》课程讲义
7
3.其它方式