当前位置:文档之家› 第2讲 新手入门指南

第2讲 新手入门指南

[GSW] Getting Started with Stata for Windows 新手入门指南(第二讲)Stata是一个博大精深的(rich and deep)统计软件包,正如统计学本身的博大精深。

新用户的最佳学习途径是练习手册上的每一个例子,在这方面花费时间多多练习会对今后从事真正的统计分析大有裨益(great benefit)。

Stata全部的官方指导手册都有一个符号标识:[GSM] Getting Started with Stata for Mac[GSU] Getting Started with Stata for Unix[GSW] Getting Started with Stata for Windows[U] Stata User’s Guide[R] Stata Base Reference Manual[D] Stata Data Management Reference Manual[G] Stata Graphics Reference Manual[XT] Stata Longitudinal-Data/Panel-Data Reference Manual[ME] Stata Multilevel Mixed-Effects Reference Manual[MI] Stata Multiple-Imputation Reference Manual[MV] Stata Multivariate Statistics Reference Manual[PSS] Stata Power and Sample-Size Reference Manual[P] Stata Programming Reference Manual[SEM] Stata Structural Equation Modeling Reference Manual[SVY] Stata Survey Data Reference Manual[ST] Stata Survival Analysis and Epidemiological Tables Reference Manual[TS] Stata Time-Series Reference Manual[TE] Stata Treatment-Effects Reference Manual:Potential Outcomes/Counterfactual Outcomes[ I ] Stata Glossary and Index[M] Mata Reference Manual1.Stata入门示例第二讲将介绍几个Stata可以完成的基本任务,如打开一个数据集,调查数据集的内容,使用一些描述性统计,制作一些图表,并做一个简单的回归分析。

这个方法应该给你一个直观印象:Stata可以做什么,以及Stata是如何工作的。

会通过两种模式来进行:一是菜单和对话框模式;二是Stata命令行模式,这样就可以熟悉这两种模式。

一、打开示例文件:1. 选择File > Example Datasets2. 点击Example datasets installed with Stata3. 点击use for auto.dta二、简单的数据管理命令:browse(1快捷键;2菜单;3命令,三种方式)数据窗口类似于Excel电子表格,纵列表示变量,横行表示观测值。

单元格中的数据有多种颜色:数值型变量:黑色字符串变量:红色分类变量:蓝色命令:describe (描述数据结构)引申命令:notes (数据集的注释)命令:summarize (变量的概要统计)引申命令:codebook (更详细的描述数据集的结构、内容和变量值)codebook makecodebook foreign给分类变量/指标(虚拟)变量添加值标签有两个优点:第一,变量存储为1个字节占用更少内存,相反,存储字符串“Domestic”需要8个字节。

第二,指标变量很容易纳入统计模型。

引申命令:codebook rep78引申命令:browse if missing(rep78) (仅显示缺失值)命令:list make if missing(rep78) [注意用法:if条件语句和missing()函数]三、描述性统计summarize price, detailbrowse if price>13000tabulate foreign (一维频数表one-way table,借助了值标签和变量标签)tabulate rep78 (一维频数表one-way table)tabulate rep78 foreign, row (二维交互表Two-way table,row表示加入行内百分比)方法1:summarize mpg if foreign==0summarize mpg if foreign==1方法2:by foreign,sort: summarize mpg (比前面的命令更好:第一,值标签代替了数字,分组清楚明了;第二,不必事先知道分组变量的数值。

注意:前缀命令by的用法)by foreign,sort: summarize mpg方法3:tabulate foreign,summarize(mpg)四、一个简单的假设检验ttest mpg,by(foreign) (检验进口车和国产车的平均油耗是否相同)五、描述性统计——相关矩阵correlate mpg weightby foreign,sort: correlate mpg weightcorrelate mpg weight length turn displacement六、作图scatter mpg weight 或twoway(scatter mpg weight)twoway(scatter mpg weight),by(foreign,total)七、模型拟合:线性回归如上图所示,可以得出两点结论:第一,mpg 和weight 的关系是非线性的,所以引入weight 的平方项;第二,进口车和国产车的关系不同,所以引入foreign 指标(虚拟)变量。

因此,拟合模型:20123mpg weight weight foreign =β+β+β+β+εregress mpg weight c.weight#c.weight foreignpredict mpghat (得到预测值/拟合值)twoway(scatter mpg weight)(line mpghat weight,sort), by(foreign)引申出一个构建模型的问题:移动2000磅1英里与移动1000磅1英里相比,应该消耗两倍的能量。

也就是说,重量和能量是线性关系,而英里(每加仑英里数(Miles per gallon))和重量不是线性关系,所以每英里加仑数(gallons per mile)是重量的线性函数。

因此,操作如下:generate gp100m=100/mpglabel variable gp100m “Gallons per 100 miles” (添加变量标签是为了作图更清楚)twoway(scatter gp100m weight), by(foreign,total)regress gp100m weight foreign结论:从前面的描述性统计我们发现,进口车比国产车油耗更低(mpg更大),这是因为进口车重量更轻的缘故。

根据我们的模型,相同重量的进口车比国产车每百英里额外耗油0.622加仑(或5品脱)。

Stata的强项之一就是其命令语法的一致性。

大多数Stata命令共享通用的语法规则,其中方括号表示可选项,varlist表示变量列表。

[prefix:] command [varlist] [if] [in] [weight] [,options]一些通用规则:1.大多数命令允许前缀命令,一个常用的前缀命令是by2.如果没有指定varlist,那就表示纳入全部变量。

3.if和in限定了命令运行的数据子集。

4.options表示命令的可选项。

5.每条命令的语法都能在系统帮助(help)和参考手册中找到。

例如,查找summarize的详细语法规则有三种方式:第一,手册[R] summarize;第二,菜单Help > Stata Command,输入summarize;第三,命令窗口help summarize 6.Stata的命令语法包括更多没有在这里演示的内容,这里的介绍只是引导你入门的指南,详细信息可以借助help language八、记录工作日志如果我们记录了工作日志,就可以方便的回顾操作历史。

日志文件记录了出现在结果窗口的全部操作内容,包含输入的命令和输出的结果。

创建日志文件的三种方法:方法1:快捷键方法2:菜单方法3:命令(log using filename )临时打开和关闭:log onlog off关闭日志文件:log close重新打开日志文件:log using filename,append2. Stata的用户界面一、窗口用户界面包括:主窗口、工具栏、菜单和对话框。

五个主窗口分别是命令回顾窗口、结果窗口、命令窗口、变量窗口和属性窗口。

还有其他的专门窗口,如浏览器,数据编辑器,变量管理器,Do-file编辑器,图表窗口和图表编辑窗口。

可以从窗口菜单中选择窗口,或从工具栏中选择合适的窗口。

二、工具栏工具栏包含快捷键,可以快速访问Stata更常用的功能。

工具栏快捷键及其功能的概述:Open 打开一个Stata数据集。

Save 把内存中的数据集保存到磁盘。

Print 选择某一窗口,并打印其中的内容。

Log 创建一个新的日志或关闭、暂停或恢复当前日志。

Viewer 打开浏览器。

Graph 显示图形窗口。

Do-file Editor 打开Do-file编辑器。

Data Editor (Edit) 打开数据编辑器。

Data Editor (Browse) 打开数据编辑器的浏览模式。

Variables Manager 打开变量管理器。

Clear —more—Condition 输出结果暂停后继续进行。

Break 停止Stata的当前任务。

三、命令窗口命令窗口类似于人机交互界面,命令通过窗口提交给Stata完成指定操作。

命令窗口支持基本的文本修改、复制粘贴、命令历史记录(Page Up/Page Down翻页键)、功能键映射。

四、结果窗口滚动结果窗口来查看先前完成的工作,或者通过搜索栏在结果窗口内搜索,两种方法:①Edit > Find;②快捷键Ctrl+F。

相关主题