当前位置:文档之家› 多元统计分析作业一

多元统计分析作业一

实验内容
出色完成30分
良好完成25分
基本完成20分
部分完成15分
初步完成5分
实验步骤
精益求精30分
比较完善25分
合乎要求20分
缺少步骤15分
少重要步骤5分
实验结论
(心得体会)
分析透彻20分
分析合理17分
合乎要求14分
结论单薄8分
难圆其说4分
工作态度
勇于探索20分
能够务实17分
中规中矩14分
华而不实8分
输出结果1-2
主体间因子
值标签
N
分类
边远及少数民族聚居区社会经济发展水平
9
全国经济平均发展水平
1
多变量检验a
效应

截距
Pillai的跟踪
.990
.000
Wilks的Lambda
.010
.000
Hotelling的跟踪
.000
Roy的最大根
.000
分类
Pillai的跟踪
.834
.101
Wilks的lambda
.166
.101
Hotelling的跟踪
.101
Roy的最大根
.101
a.精确统计量
4.实验结果(或心得体会):
通过实验,得出输出结果1-4是上面多重比较可信性的度量,并且由Sig.值可以让我们看到,比较检验是可信的。利用spss可将多指标数据进行良好的分析。
5.指导教师点评(总分100分,所列分值仅供参考,以下部分打印时不可以断页)
式中
(人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲)
分类
上面多变量检验表实际上是对该线性模型显著性的检验,此处有常数项 是因为不能肯定模型过原点。而模型没有通过显著性检验,意味着分类中的不同取值对Y的取值无显著影响,也就是说,不同分类的经济发展水平是相同的。
但是,在实际中,我们往往更希望知道差别主要来自哪些分类,或者不同分类经济发展水平的比较。对此,对GLM模块的选项作如下设置:在GLM主对话框中点击Contrasts…按钮进入Contrasts对话框,在Change Contrasts框架中打开Contrasts右侧的下拉框并选择Simple,此时下侧的Reference Category被激活,默认是Last被选中,表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较,点击Change按钮,Continue继续,OK进行,得到如下结果(见输出结果1-3)
课 程 名 称:多元统计回归分析
实 验 项 目:边远及少数民族聚居区和会经济发展水平
实 验 类 型:验证性
学 生 学 号:
学 生 姓 名:
学 生 班 级:
课 程 教 师:
实 验 日 期:2016-03-28
1.实验目的:
利用spss软件验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。
输出结果1-3
对比结果(K矩阵)
分类简单对比a
因变量
人均GDP
三产比重
人均消费
人口增长
文盲半文盲
级别1和级别2
对比估算值
假设值
0
0
0
0
0
差分(估计-假设)
标准误差
Sig.
.114
.656
.035
.355
.466
差分的95%置信区间
下限
上限
a.参考类别= 2
见输出结果1-3表示
(1)在显著性水平 的水平下,可以看到Sig.值分别为、、、、,由此我们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别,即全国的平均人均消费大于边远及少数民族聚居区人均消费,相差值为元。人均GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别。
资料来源:《中国统计年鉴(1998)》,北京,中国统计出版社,1998。
五项指标的全国平均水平为:
3.实验步骤及结果:
解:(1)先利用SPSS软件检验各变量是否遵从多元正态分布(见输出结果1-1)
输出结果1-1
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
Df
Sig.
(2)在显著性水平 的水平下,可以看到Sig.值分别为、、、、均大于显著性水平 ,我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别。
输出结果1-4
多变量检验结果

F
假设df
误差df
Sig.
Pillai的跟踪
.834
(2)提出原假设及备选假设
(3)做出统计判断,最后对统计判断作出具体的解释
SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。依次点选Analyze General Linear Mode lMultivariate……进入Multivariate对话框,将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框,将分类指标选入Fixed Factor(s)框,点击OK运行,则可以得到如下结果(见输出结果1-2)。
边远及少数民族聚居区社会经济发展水平的指标数据
地区
人均GDP(元)
三产比重(%)
人均消费(元)
人口增长(%)
文盲半文盲(%)
内蒙古
5068
2141
广西
4076
2040
贵州
2342
1551
云南
4355
2059
西藏
3716
1551
宁夏
4270
1947
新疆
6229
2745
甘肃
3456
1612
青海
4367
2047
上表给出了对每一个变量进行正态性检验的结果,因为该例中样本数n=9,所以此处选用Shapiro-Wilk统计量。则Sig.值分别为、、、、均大于显著性水平,由此可以知道,人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。
.101
Wilks的Lambda
.166
.101
Hotelling的跟踪
.101
Roy的最大根
.101
a.设计:截距+分类
b.精确统计量
上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。第二张表是多变量检验表,该表给出了几个统计量。由Sig.值可以看到,无论从哪个统计量来看,两个分类的经济发展水平是无显著差别的。实际上,GLM模型是拟合了下面的模型:
态度不端正0分
总 分
有抄袭剽窃行为则实验成绩记为零分,并且严重警告!!
教师签字: 日期: 年 月 日
注:验证性实验仅上交电子文档,设计性试验需要同时上交电子与纸质文档进行备份存档。
统计量
df
Sig.
人均GDP
.219
9
.200*
.958
9
.781
三产比重
.145
9
.200*
.925
9
.437
人均消费
.209
9
.200*
.873
9
.131
人口增长
.150
9
.200*
.949
9
.682
文盲半文盲
.246
9
.124
.898
9
.242
*.这是真实显著水平的下限。
a. Lilliefors显著水平修正
2.实验内容:
现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标,验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。
相关主题