当前位置：文档之家› 多元统计分析作业一第三题.doc

多元统计分析作业一第三题.doc

5.037
4.029b
5.000
4.000
.101
Roy的最大根
5.037
4.029b
5.000
4.000
.101
a.设计:截距+分类
b.精确统计量
上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。第二张表是多变量检验表，该表给出了几个统计量。由Sig.值可以看到，无论从哪个统计量来看，两个分类的经济发展水平是无显著差别的。实际上，GLM模型是拟合了下面的模型：
边远及少数民族聚居区社会经济发展水平的指标数据
地区
人均GDP（元）
三产比重（%）
人均消费（元）
人口增长（%）
文盲半文盲（%）
内蒙古
5068
31.1
2141
8.23
15.83
广西
4076
34.2
2040
9.01
13.32
贵州
2342
29.8
1551
14.26
28.98
云南
4355
31.3
2059
12.1
式中
(人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲)
分类
上面多变量检验表实际上是对该线性模型显著性的检验，此处有常数项是因为不能肯定模型过原点。而模型没有通过显著性检验，意味着分类中的不同取值对Y的取值无显著影响，也就是说，不同分类的经济发展水平是相同的。
但是，在实际中，我们往往更希望知道差别主要来自哪些分类，或者不同分类经济发展水平的比较。对此，对GLM模块的选项作如下设置：在GLM主对话框中点击Contrasts…按钮进入Contrasts对话框，在Change Contrasts框架中打开Contrasts右侧的下拉框并选择Simple，此时下侧的Reference Category被激活，默认是Last被选中，表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较，点击Change按钮，Continue继续，OK进行，得到如下结果（见输出结果1-3）
.145
9
.200*
.925
9
.437
人均消费
.209
9
.200*
.873
9
.131
人口增长
.150
9
.200*
.949
9
.682
文盲半文盲
.246
9
.124
.898
9
.242
*.这是真实显著水平的下限。
a. Lilliefors显著水平修正
上表给出了对每一个变量进行正态性检验的结果，因为该例中样本数n=9，所以此处选用Shapiro-Wilk统计量。则Sig.值分别为0.781、0.437、0.131、0.682、0.242均大于显著性水平，由此可以知道，人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布，即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。
五项指标的全国平均水平为：
3.实验步骤及结果:
解：（1）先利用SPSS软件检验各变量是否遵从多元正态分布（见输出结果1-1）
输出结果1-1
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
Df
Sig.
统计量
df
Sig.
人均GDP
.219
9
.200*
.958
9
.781
三产比重
课程名称：多元统计回归分析
实验项目：边远及少数民族聚居区和会经济发展水平
实验类型：验证性
学生学号：
学生姓名：
学生班级：
课程教师：
实验日期：2016-03-28
1.实验目的：
利用spss软件验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。
输出结果1-3
对比结果（K矩阵）
分类简单对比a
因变量
人均GDP
三产比重
人均消费
人口增长
文盲半文盲
级别1和级别2
对比估算值
-2003.232
2.274
-1006.111
2.712
12.014
假设值
0
0
0
0
0
差分（估计-假设）
-2003.232
2.274
-1006.111
2.712
12.014
标准误差
1129.265
Hotelling的跟踪
102.482
81.986b
5.000
4.000
.000
Roy的最大根
102.482
81.986b
5.000
4.000
.000
分类
Pillai的跟踪
.834
4.029b
5.000
4.000
.101
Wilks的Lambda
.166
4.029b
5.000
4.000
.101
Hotelling的跟踪
4.g.
.114
.656
.035
.355
.466
差分的95%置信区间
下限
-4607.321
-9.053
-1918.967
-3.655
-24.162
上限
600.857
13.602
（2）提出原假设及备选假设
（3）做出统计判断，最后对统计判断作出具体的解释
SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。依次点选Analyze General Linear Mode lMultivariate……进入Multivariate对话框，将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框，将分类指标选入Fixed Factor(s)框，点击OK运行，则可以得到如下结果（见输出结果1-2）。
2.实验内容:
现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标，验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。
输出结果1-2
主体间因子
值标签
N
分类
1.00
边远及少数民族聚居区社会经济发展水平
9
2.00
全国经济平均发展水平
1
多变量检验a
效应
值
F
假设df
误差df
Sig.
截距
Pillai的跟踪
.990
81.986b
5.000
4.000
.000
Wilks的Lambda
.010
81.986b
5.000
4.000
.000
25.48
西藏
3716
43.5
1551
15.9
57.97
宁夏
4270
37.3
1947
13.08
25.56
新疆
6229
35.4
2745
12.81
11.44
甘肃
3456
32.8
1612
10.04
28.65
青海
4367
40.9
2047
14.48
42.92
资料来源：《中国统计年鉴（1998）》，北京，中国统计出版社，1998。

e商务文档

多元统计分析作业一第三题.doc

相关文档推荐：