当前位置:文档之家› 第五章 聚类分析(修改)

第五章 聚类分析(修改)


2012-10-30
2
3、基本思路:根据地理变量(或指标或样品)
的属性或特征的相似性、亲疏程度,用数学的 方法把它们逐步地分型划类,最后得到一个能 反映个体或群体之间亲疏关系(相似程度)的 分类系统
2012-10-30
3
二、聚类分析的具体步骤
(一)确定研究对象,建立指标体系, 构建聚类要素矩阵 (二)聚类要素的数据处理
2:青岛 0.9960 1.0000 0.9980 0.9780 0.9770 0.9980 0.9790 0.9810 0.9700 0.9910 0.9730 0.9840 0.9230 0.9810 0.9430 0.9700 0.8010
3:淄博 0.9960 0.9980 1.0000 0.9650 0.9840 0.9950 0.9660 0.9680 0.9540 0.9970 0.9580 0.9750 0.8990 0.9690 0.9210 0.9550 0.7650
17地市两两地市间的夹角余旋
2012-10-30 13
(2)相关系数r
为了衡量要素(变量)或指标之间的亲疏关系,也常用 相关系数作为分类统计量,即计算出两两样本之间的相关 系数(不再重复)。
Case 1:济南 1:济南 1.0000 2:青岛 0.9940 3:淄博 0.9940 4:枣庄 0.9600 5:东营 0.9650 6:烟台 0.9960 7:潍坊 0.9620 8:济宁 0.9610 9:泰安 0.9480 10:威海 0.9860 11:日照 0.9500 12:莱芜 0.9770 13:临沂 0.8770 14:德州 0.9670 15:聊城 0.8960 16:滨州 0.9410 17:菏泽 0.6950 2:青岛 0.9940 1.0000 0.9970 0.9670 0.9760 0.9970 0.9680 0.9710 0.9540 0.9890 0.9600 0.9770 0.8850 0.9720 0.9140 0.9560 0.7070 3:淄博 0.9940 0.9970 1.0000 0.9510 0.9830 0.9930 0.9520 0.9530 0.9340 0.9970 0.9390 0.9660 0.8520 0.9560 0.8850 0.9350 0.6600 4:枣庄 0.9600 0.9670 0.9510 1.0000 0.8950 0.9710 1.0000 0.9980 0.9970 0.9220 0.9970 0.9960 0.9670 0.9990 0.9780 0.9880 0.8580 5:东营 0.9650 0.9760 0.9830 0.8950 1.0000 0.9680 0.8950 0.9060 0.8760 0.9920 0.8880 0.9090 0.7830 0.9040 0.8330 0.8960 0.5630 6:烟台 0.9960 0.9970 0.9930 0.9710 0.9680 1.0000 0.9720 0.9760 0.9630 0.9820 0.9670 0.9810 0.9020 0.9770 0.9240 0.9640 0.7300 7:潍坊 0.9620 0.9680 0.9520 1.0000 0.8950 0.9720 1.0000 0.9980 0.9970 0.9240 0.9970 0.9970 0.9660 1.0000 0.9750 0.9870 0.8550 8:济宁 0.9610 0.9710 0.9530 0.9980 0.9060 0.9760 0.9980 1.0000 0.9970 0.9270 0.9990 0.9920 0.9680 0.9990 0.9820 0.9940 0.8550 9:泰安 0.9480 0.9540 0.9340 0.9970 0.8760 0.9630 0.9970 0.9970 1.0000 0.9020 0.9990 0.9900 0.9820 0.9970 0.9870 0.9920 0.8850 10:威海 11:日照 12:莱芜 13:临沂 14:德州 15:聊城 16:滨州 17:菏泽 0.9860 0.9500 0.9770 0.8770 0.9670 0.8960 0.9410 0.6950 0.9890 0.9600 0.9770 0.8850 0.9720 0.9140 0.9560 0.7070 0.9970 0.9390 0.9660 0.8520 0.9560 0.8850 0.9350 0.6600 0.9220 0.9970 0.9960 0.9670 0.9990 0.9780 0.9880 0.8580 0.9920 0.8880 0.9090 0.7830 0.9040 0.8330 0.8960 0.5630 0.9820 0.9670 0.9810 0.9020 0.9770 0.9240 0.9640 0.7300 0.9240 0.9970 0.9970 0.9660 1.0000 0.9750 0.9870 0.8550 0.9270 0.9990 0.9920 0.9680 0.9990 0.9820 0.9940 0.8550 0.9020 0.9990 0.9900 0.9820 0.9970 0.9870 0.9920 0.8850 1.0000 0.9100 0.9410 0.8090 0.9300 0.8490 0.9070 0.5980 0.9100 1.0000 0.9880 0.9780 0.9970 0.9890 0.9960 0.8770 0.9410 0.9880 1.0000 0.9470 0.9970 0.9550 0.9750 0.8200 0.8090 0.9780 0.9470 1.0000 0.9660 0.9900 0.9750 0.9530 0.9300 0.9970 0.9970 0.9660 1.0000 0.9760 0.9890 0.8500 0.8490 0.9890 0.9550 0.9900 0.9760 1.0000 0.9920 0.9230 0.9070 0.9960 0.9750 0.9750 0.9890 0.9920 1.0000 0.8700 0.5980 0.8770 0.8200 0.9530 0.8500 0.9230 0.8700 1.0000
x
ij
2012-10-30
7
2、对变换后的数据进行标准化处理
(1)极差标准化
x ij x ij x j (min) x j (max) x j (min) ( i 1, 2 ..., n ; j 1, 2 ,..., m )
(2)标准差标准化
x ij
(三)构建聚类分析的统计量(计算点与 点之间距离) (四)选择聚类方法(计算类与类之间距 离),画出分类谱系图
2012-10-30 4
(一)确定研究对象,建立指标体系,建
聚类要素矩阵
1、本例是对样本的划分,因而是Q型聚类 2、本例的指标为:
2012-10-30
5
3、原始数据矩阵
x1 x2 x 12 x 22
4:枣庄 0.9730 0.9780 0.9650 1.0000 0.9160 0.9800 1.0000 0.9990 0.9980 0.9440 0.9980 0.9970 0.9780 1.0000 0.9850 0.9910 0.9050
5:东营 0.9690 0.9770 0.9840 0.9160 1.0000 0.9730 0.9160 0.9250 0.9040 0.9920 0.9130 0.9260 0.8380 0.9230 0.8740 0.9200 0.6780
6:烟台 0.9970 0.9980 0.9950 0.9800 0.9730 1.0000 0.9800 0.9830 0.9740 0.9870 0.9770 0.9860 0.9330 0.9840 0.9480 0.9750 0.8150
7:潍坊 0.9740 0.9790 0.9660 1.0000 0.9160 0.9800 1.0000 0.9990 0.9980 0.9450 0.9980 0.9980 0.9770 1.0000 0.9830 0.9900 0.9030
10:威海 11:日照 12:莱芜 13:临沂 14:德州 15:聊城 16:滨州 17:菏泽 0.9890 0.9660 0.9840 0.9180 0.9770 0.9300 0.9600 0.7930 0.9910 0.9730 0.9840 0.9230 0.9810 0.9430 0.9700 0.8010 0.9970 0.9580 0.9750 0.8990 0.9690 0.9210 0.9550 0.7650 0.9440 0.9980 0.9970 0.9780 1.0000 0.9850 0.9910 0.9050 0.9920 0.9130 0.9260 0.8380 0.9230 0.8740 0.9200 0.6780 0.9870 0.9770 0.9860 0.9330 0.9840 0.9480 0.9750 0.8150 0.9450 0.9980 0.9980 0.9770 1.0000 0.9830 0.9900 0.9030 0.9480 0.9990 0.9950 0.9790 0.9990 0.9880 0.9960 0.9020 0.9300 0.9990 0.9930 0.9880 0.9980 0.9910 0.9940 0.9230 1.0000 0.9360 0.9570 0.8660 0.9490 0.8940 0.9340 0.7180 0.9360 1.0000 0.9920 0.9860 0.9980 0.9920 0.9970 0.9170 0.9570 0.9920 1.0000 0.9650 0.9980 0.9700 0.9820 0.8800 0.8660 0.9860 0.9650 1.0000 0.9770 0.9940 0.9830 0.9680 0.9490 0.9980 0.9980 0.9770 1.0000 0.9840 0.9920 0.8990 0.8940 0.9920 0.9700 0.9940 0.9840 1.0000 0.9940 0.9480 0.9340 0.9970 0.9820 0.9830 0.9920 0.9940 1.0000 0.9110 0.7180 0.9170 0.8800 0.9680 0.8990 0.9480 0.9110 1.0000
相关主题