当前位置:
文档之家› 聚类分析的案例分析(推荐文档)
聚类分析的案例分析(推荐文档)
《应用多元统计分析》
——报告
班级:
学号:
姓名:
聚类分析的案例分析
摘要
本文主要用SPSS软件对实验数据运用系统聚类法和K均值聚类法进行聚类分析,
从而实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的
气体浓度的情况,从而判断出这几个地区的污染程度。
经过聚类分析可以得到,样本6这一地区的气体浓度值最高,污染程度是最严
重的,样本3和样本4气体浓度较高,污染程度也比较严重,因此要给予及时的
控制和改善。
关键词:SPSS软件聚类分析学生成绩
一、数学模型
聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的相
似性。可以根据这些相似性把相似程度较高的归为一类,从而对其总体进行分析
和总结,判断之间的差距。
系统聚类法的基本思想是在这几个样本之间定义其之间的距离,在多个变量之
二、数据来源
《应用多元统计分析》第一版164页第6题
我国山区有一某大型化工厂,在该厂区的邻近地区中挑选其中最具有代表性的
8个大气取样点,在固定的时间点每日4次抽取6种大气样本,测定其中包含的
8个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及
大气污染气体进行分类。
三、建立数学模型
一、运行过程
1
间定义其相似系数,距离或者相似系数代表着样本或者变量之间的相似程度。根
据相似程度的不同大小,将样本进行归类,将关系较为密切的归为一类,关系较
为疏远的后归为一类,用不同的方法将所有的样本都聚到合适的类中,这里我们
用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。
K均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。