聚类分析的验证实验
Label Num +---------+---------+---------+---------+---------+
Bangladesh 2 -+-+
Cambodia 3 -+ +-----+
Afghanistan 1 ---+ +---------------------------------------+
China 4 -+ | |
Indonesia 7 ---+-------+ |
Malaysia 9 ---+ | |
Philippines 12 ---+ +-----------------+
S. Korea 13 -+---+ |
Taiwan 15 -+ +-----+
N. Korea 10 -----+
实验步骤及实验结果:
1.
2.
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
群集1
群集2
1
2
3
.146
0
0
10
2
16
17
.294
0
0
5
3
5
14
.299
0
0
12
4
13
15
.390
0
0
11
5
4
16
.423
0
2
7
6
6
11
.522
0
0
13
7
4
7
.573
5
0
9
8
9
12
.595
0
0
9
9
4
9
.723
7
8
14
10
多元统计分析实验报告
实验名称
聚类分析的验证
姓名
马思媛
学号
1405020120
班级
14应用统计
实验地点
B209
实验日期
2015.的:
1.掌握SPSS进行系统聚类及K均值聚类的具体操作方法
2.了解适合于用聚类分析方法解决的问题并能用SPSS软件实现求解
实验内容:
1.查找SPSS自带数据WORD95.SAV,并把其中亚洲国家的数据筛选出来
由此可见第一类为:孟家拉国,柬埔寨,印度,巴基斯坦,
第二类为:中国香港,新加坡,日本
第三类为:泰国越南,中国大陆,印度尼西亚,马来西亚,菲律宾,韩国,中国台湾,朝鲜。
4.
实验总结:
系统聚类的方法和K值聚类为我们更好的提供对于数据的处理与分析,在实验过程中我们还是会不熟悉Spss的应用,所以在今后的学习中我们依旧要认真对待,坚持学习。
注:实验报告电子版命名方式为:学号+姓名+实验名称,实验结束后发至:学委邮箱。
2.掌握方法的选择,数据的标准化的选择,输出谱系图的命令;
3.对亚洲国家利用城市人口比例,男性平均寿命,女性平均寿命,有读写能力的人所占的比例,人均国内生产总值这五个量进行系统聚类。写出聚类的结果,如果分成三类,哪些国家属于一类。
4.利用K均值聚类方法的操作步骤及结果
5.利用电子版数据练习系统聚类。
1
2
.901
0
1
13
11
10
13
1.039
0
4
14
12
5
8
1.262
3
0
15
13
1
6
1.744
10
6
16
14
4
10
2.141
9
11
15
15
4
5
5.694
14
12
16
16
1
4
10.000
13
15
0
4
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
India 6 -+-------+ |
Pakistan 11 -+ |
Hong Kong 5 -+---+ |
Singapore 14 -+ +-----------------------+ |
Japan 8 -----+ | |
Thailand 16 -+ | |
Vietnam 17 -+-+ +-------------------+