当前位置:文档之家› Stata实验指导书.doc-武汉理工大学

Stata实验指导书.doc-武汉理工大学

实验指导书
武汉理工大学政治与行政学院
2013年4月
实验一STATA基本介绍
实验目的
掌握什么是STATA?该软件具有什么功能?熟悉STATA菜单各项的含义,数据输入、存储以及数据运算与处理等。

实验内容
1.什么是STATA
2.STATA的菜单
3.数据输入与保存
4、数据文件的合并与汇总
5.数据编辑整理
6.变量重新赋值
7.数据的运算与新变量的生成
8.数据的排序
9.数据分组
基本步骤
当打开STATA后,展现在我们面前的界面如下:
菜单栏共有11个选项,常用的有以下8个选项:
1.文件:文件管理菜单,有关文件的调入、存储、显示和打印等;
2.编辑:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等; 3.显示:显示菜单,有关状况栏、工具条、网格线是否显示,以及数据显示的字体类型、大小等设置;
4.数据:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等;
5.转换:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等;
6.分析:统计菜单,有关一系列统计方法的应用;
7.图形:作图菜单,有关统计图的制作;
8.使用程序:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等;
实验报告
自己草拟10名学生的序号、姓名、统计学成绩、管理学成绩、每天学习时间特征资料。

(以自己的姓名作为第一号,并以自己的名字设为文件名)要求:
(1)添加性别数据特征;
粘贴处
(2)按统计学成绩由高到低排序;
粘贴处
(3)按统计学成绩数量标志进行等距分组,并进行汇总统计。

粘贴处
(4)计算生成统计学与管理学两科的总成绩与平均成绩两个变量。

粘贴处
实验二STATA统计绘图
实验目的
掌握条形图、线形图、散点图、直方图等常用统计图的绘制方法与技巧。

实验内容
1.条形图
2.线形图
单线形图(Simple)
多线形图(Multiple)
垂线形图(Drop-line)
3.散点图
简单散点图(Simple)——显示一对相关变量关系;
重叠散点图(Overlay) ——显示多对相关变量关系;
矩阵散点图(Matrix) ——显示多个相关变量关系;
3维散点图(3-D) ——显示3个相关变量关系。

4.直方图
用直条的长短来表示连续性的绝对数(或频数)资料的多少,直条的宽度表示数据范围的间隔,高度表示在给定间隔内的数据频数。

适用于连续性数据变量。

5.面积图
面积图又称为区域图,用线段下的阴影面积来强调现象变化的变化的统计图。

6.饼图
又称为圆图,以圆面积100%,圆内扇形面积为各部分所占百分比,用于表示全体中各部分构成。

基本步骤
1.绘制简单条图
例1.1:在STATA自带数据集anxiety.sav中分不同的subject对变量score 值(之和)绘制条图。

例1.2:在数据集anxiety.sav中分不同的subject对变量score值(之和)绘制条图,并且按变量trial的不同取值堆积(分段)。

2.绘制线形图
例2.1:我国改革开放以来部分农业产品产量的变化,试以单个变量多线形图来反映其变化。

(见STATA练习中国人均农业农产品产量)3.绘制散点图
例3.1:随机抽取15人调查获取资料:(STATA练习12)要求:绘制学习时间与统计成绩之间相关的散点图。

4.绘制直方图
例4.1:随机抽取15人调查获取资料:(STATA练习12)要求:绘制15人统计成绩直方图,并分析成绩状况。

5.面积图
例5.1 1978~2006年历年人口出生率、死亡率和自然增长率(单位:‰),已建立数据文件nature.sav,试绘制历年人口自然增长率的简单面积图。

例5.2 1978~2006年历年人口出生率、死亡率和自然增长率(单位:‰),已建立数据文件nature.sav,试绘制人口出生率、死亡率的堆积面积图。

6.饼图
例6.1:北京2004年城区及近郊区户籍人口数据,试以饼图来反映北京城区及近郊区户籍人口比例关系
实验报告
1、知不同人群每月钙的应摄入量及实际摄入量如下,试绘制不同
人群钙的应摄入量与实际摄入量的复式条形图及三维条形图,并对图形进行简要分析说明。

2知我国1953~1985年各工业部门产值结构的构成(%),试绘制堆积面积图,并对图形进行简要分析说明。

实验三描述性分析
实验目的
统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。

通过调用摘要性分析的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资料,可完成构成比率等指标的计算。

实验内容
1.频数分布表的分析:频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。

2.描述性统计分析:计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存入数据库。

3.探索分析:对变量进行更为深入详尽的描述性统计分析
4.交互分析:适用于两个或两个以上变量交叉分类形成列联表,对变量的关联性进行分析。

数量变量和类别变量都可以进行。

基本步骤
1.频数分析
打开【分析】选择【频率】
对每一项目对应多个反应(如多项选择)的数据进行频次分析。

菜单位置:【分析】【多重响应】【定义变量集】【频率】
2.描述性分析
打开【分析】--【描述统计】--【描述】
3.探索分析
打开【分析】--【描述统计】--【探索】
4.交互分析
菜单位置:【分析】--【描述统计】--【交叉】
实验报告
某百货公司连续40天的商品销售额如下(单位:万元)
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
要求:
(1)根据以上的数据进行适当的分组,编制频数分布表,并绘制频数分布的直方图;
粘贴
(2)计算适当的统计指标对该百货公司这40天的销售情况进行描述说明。

实验四相关分析
实验目的
掌握相关分析的基本概念、相关系数及其检验和偏相关分析。

实验内容
1.两变量的相关分析
假设对10户居民家庭的月可支配收入和消费支出进行调查,得到的原始资料如下:单位:百元
编号 1 2 3 4 5 6 7 8 9 10 消费支出20 15 40 30 42 60 65 70 53 78
25 18 60 45 62 88 92 99 75 98 可支配收

试分析消费支出与可支配收入之间的关系?
2.偏相关分析
某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表, 试对该资料作控制身高影响作用的体重与肺活量相关分析。

基本步骤
1.两变量的相关分析
【分析】—【相关分析】---【双变量】
2.偏相关分析
【分析】—【相关分析】---【偏相关】
实验报告
. 下表数据是某公司太阳镜销售情况。

分析销售量与平均价格、广告费用和日照时间之间的关系。

作图协助分析,此题使用偏相关分析是
否有实际
粘贴
实验五 回归分析
实验目的
一元线性回归简单地说是涉及一个自变量的回归分析,主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。

本实验要求掌握一元线性回归的求解和多元线性回归理论与方法。

实验内容
1.一元线性回归 一元线性回归的求解
2
1
1
()()()x x y y x x n xy x y y x
ββ
β--=
--=
=-∑∑
一元线性回归的相关系数和可决系数;一元线性回归方程的统计
检验。

2.多元线性回归
多元线性回归就是研究某一个因变量和多个自变量之间的相互关系的理论与方法。

对于一个实际研究的问题,并不是变量选择越多越好,因为这样一来会增加数据的需求量,同时有些变量因素对因变量的作用也不显著,许多变量相互关联,一些变量的作用可被其他变
量代替。

基本步骤
1.一元线性回归
【分析】--【回归】---【线性】
2.多元线性回归
【分析】--【回归】---【线性】
3.曲线回归
【分析】--【回归】---【曲性估计】
实验报告
下表是某企业1987~1998年的经济效益、科研人员、科研经费的统计数据。

假定1999年该企业科研人员61名、科研经费40万元,试预测1999年该企业的经济效益。

(要求粘贴主要过程图,写出回归方程,并进行预测。


粘贴
测验题结果填写处。

相关主题