当前位置:文档之家› 实验5多元统计分析spss

实验5多元统计分析spss

青岛农业大学
多元统计分析实验报告
姓名:庞云杰
学号:20155653
班级:信计1502
指导老师:徐英
2017年11月28日
多元统计分析实验课:实验五
实验题目主成分分析
实验目的了解SPSS软件,掌握SPSS软件处理主成分分析的基本操

实验地点及时间信息楼127机房,周二8-9节
实验内容
1. 了解SPSS软件及常用功能;
2.了解主成分分析的原理;
3.掌握SPSS软件处理主成分分析的操作过程和技巧。

实验习题
1.题目简述:中国大陆31个省(市、区)2008年第三产业综合发展水平的主成分分析与评估。

选取了人均地区生产总值(元)、人均第三产业增加值(元)、第二产业占GDP的比重、第三产业占GDP的比重、第三产业就业人员比重、城镇化水平(%)、第三产业固定资产投资比重八项指标,具体数据见附件。

根据以上数据分析结果对全国31个地区的第三产业综合发展水平进行综合评价,并整理实验报告。

解答如下:
2.(1)首先对原始数据作标准化处理,然后计算标准化后的各指标之间的相关系数矩阵;
(标准化过程:点击分析—描述统计—描述;
相关系数矩阵过程:点击分析—相关—双变量然后确定。


相关性
Zscore: 人均地区生产总值/
元Zscore:
人均第三
产业增加
值/元
Zscore:
第二产业
占GDP的比
重/%
Zscore:
第三产业
占GDP的比
重/%
Zscore:
第三产业
就业人员
比重/%
Zscore:
城镇化水
平/%
Zscore:
第三产业固
定资产投资
比重/%
Zscore: 人均地区生产总值/元Pearson
相关性
1 .933**.037 .532**.760**.930**-.005
显著性
(双侧)
.000 .844 .002 .000 .000 .980 N 31 31 31 31 31 31 31
Zscore: 人均第三产业增加值/元Pearson
相关性
.933** 1 -.254 .768**.894**.874**.142
显著性
(双侧)
.000 .168 .000 .000 .000 .446 N 31 31 31 31 31 31 31
Zscore: 第二产业占GDP的比重/% Pearson
相关性
.037 -.254 1 -.734**-.378*.051 -.667**
显著性
(双侧)
.844 .168 .000 .036 .786 .000 N 31 31 31 31 31 31 31
Zscore: 第三产业占GDP的比重/% Pearson
相关性
.532**.768**-.734** 1 .802**.463**.505**
显著性
(双侧)
.002 .000 .000 .000 .009 .004 N 31 31 31 31 31 31 31
Zscore: 第三产业就业人员比重/% Pearson
相关性
.760**.894**-.378*.802** 1 .779**.270
显著性
(双侧)
.000 .000 .036 .000 .000 .142 N 31 31 31 31 31 31 31
Zscore: 城镇化水平/% Pearson
相关性
.930**.874**.051 .463**.779** 1 -.020
显著性
(双侧)
.000 .000 .786 .009 .000 .917 N 31 31 31 31 31 31 31
Zscore: 第三产业固定资产投资比重/% Pearson
相关性
-.005 .142 -.667**.505**.270 -.020 1
显著性
(双侧)
.980 .446 .000 .004 .142 .917
N 31 31 31 31 31 31 31
**. 在 .01 水平(双侧)上显著相关。

*. 在 0.05 水平(双侧)上显著相关。

(2)计算出相关系数矩阵的特征值,以及各主成分的贡献率和累计贡献率,并根据累计贡献率的结果选取合适的主成分;
解释的总方差
成份
初始特征值提取平方和载入
合计方差的 % 累积 % 合计方差的 % 累积 %
1 4.291 61.306 61.306 4.291 61.306 61.306
2 1.969 28.124 89.430 1.969 28.124 89.430
3 .426 6.091 95.522
4 .149 2.12
5 97.646
5 .115 1.649 99.295
6 .038 .548 99.844
7 .011 .156 100.000
提取方法:主成份分析。

(3)计算主成分载荷矩阵,并计算出相关主成分的系数向量,列出主成分的函数表示式;
成份矩阵a
成份
1 2
Zscore: 人均地区生产总值/

.862 .448
Zscore: 人均第三产业增加
值/元
.969 .192
Zscore: 第二产业占GDP的比
重/%
-.418 .847
Zscore: 第三产业占GDP的比
重/%
.857 -.421
Zscore: 第三产业就业人员
比重/%
.944 .009
Zscore: 城镇化水平/% .837 .470
Zscore: 第三产业固定资产
投资比重/%
.329 -.784
提取方法 :主成分分析法。

a. 已提取了 2 个成份。

设主成分1为,主成分2为
()
()
(4)计算选取的各个主成分得分,并以主成分的方差贡献率为权重计算出综合得分;
()
()
地区T1 T2 Z1 Z2 y1 y2 F
北京0.862 0.448 0.416 0.319 6.84 -1.1 3.88 上海 4.47 1.08 3.04 天津0.969 0.192 0.468 0.137 1.45 2 1.45 浙江0.75 1.3 0.83 广东0.86 0.83 0.76 江苏0.37 1.78 0.73 辽宁0.837 0.47 0.404 0.335 0.07 1.44 0.45 山东-0.46 1.33 0.09 内蒙古0.944 0.009 0.456 0.006 -0.37 1.13 0.09 福建0.06 0.02 0.04 吉林0.329 -0.784 0.159 -0.559 -0.16 0.41 0.02 湖北0.14 -0.88 -0.16 重庆-0.19 -0.4 -0.23 山西0.857 -0.421 0.414 -0.3 -0.97 1.21 -0.25 黑龙江-0.69 0.25 -0.35 新疆-0.64 0.14 -0.35 宁夏-0.91 0.66 -0.37 河北-0.418 0.847 -0.202 0.604 -1.06 0.99 -0.37 青海-0.9 0.06 -0.54 湖南-0.61 -0.7 -0.57 安徽-0.93 -0.12 -0.61 四川-0.79 -0.54 -0.64
江西-1.25 0.41 -0.65 河南-1.65 1.27 -0.66 甘肃-0.72 -0.83 -0.67 贵州-0.48 -1.46 -0.71 陕西-1.04 -0.36 -0.74 海南0.07 -2.92 -0.78 西藏0.73 -4.56 -0.83 广西-0.99 -1.03 -0.9 云南-1 -1.4 -1.01
(5)根据前两个主成分得分绘制散点图并标注出地区序号;
实验总结:由实验可以得出:北京、上海、天津第三产业发展水平最高,浙江、广东、江苏、辽宁、山东、内蒙古、福建、吉林第三产业发展水平其次,湖北、重庆、山西、黑龙江、新疆、宁夏、河北、青海、湖南、安徽、四川、江西、河南、甘肃、贵州、陕西、海南、西藏、广西、云南第三产业发展水平落后。

实验成绩评阅时间评阅教师。

相关主题