当前位置:文档之家› spss样本聚类案例分析

spss样本聚类案例分析

原数据
1.1样本聚类(Q聚类)
聚类表

群集组合
系数首次出现阶群

下一阶
群集 1群集 2群集 1群集 2
157.855003 21112 1.379007 325 1.772015
41014 1.776007 526 2.451308 6813 2.7720010 71011 4.3224212 812 4.5570512 934 4.8950013 10815 5.5006011 11897.74010013 121108.3148714 133812.79091114 141316.65012130通过系数做出其散点图
群集成员
案例 5 群集 4 群集 3 群集
1:Case 1 111 2:Case 2 111 3:Case 3 222 4:Case 4 222 5:Case 5 111 6:Case 6 111 7:Case 7 111 8:Case 8 333 9:Case 9 433
541 10:Case
10
541 11:Case
11
12:Case
541 12
333 13:Case
13
14:Case
541 14
15:Case
333 15
1.2变量聚类(R聚类)
近似矩阵
案例矩阵文件输入
总人口从业人

土地面

耕地面

财政收

粮食产

总人口 1.000.857.698.714.512.043从业人

.857 1.000.597.570.643.277
土地面

.698.597 1.000.856.044-.147
耕地面

.714.570.856 1.000-.001-.335
财政收

.512.643.044-.001 1.000.342
粮食产

.043.277-.147-.335.342 1.000
聚类表

群集组合
系数首次出现阶群

下一阶
群集 1群集 2群集 1群集 2
112.857003 234.856003 313.645125 456.342005 515.129340
群集成员
案例 5 群集 4 群集 3 群集
总人口111
从业人

111
土地面

221
耕地面

321财政收

432
粮食产

543
2.K—均值聚类原数据
描述统计量
N极小值极大值均值标准差
身高月平均增长率19.3411.03 1.8842 2.5634
2
体重月平均增长率19.4950.30 5.636311.718
14
胸围月平均增长率19.1611.81 1.4958 2.7933
9
坐高月平均增长率19.1411.27 1.7111 2.8070
9
有效的 N (列表
状态)
19
输出结果:
初始聚类中心
聚类
12345
Zscore(身高月平均增长率)3.5678
1
1.3988
3
.66153.04907-.6024
Zscore(体重月平均增长率)3.8115
1.1660
3
.35959-.1251
3
-.4391
8
Zscore(胸围月平均增长率)3.6923
6
1.3260
6
.58861-.0092
3
-.4710
4
Zscore(坐高月平均增长率)3.4052
9
1.9482
6
.14212-.0466
9
-.5525
5
迭代历史记录a
聚类成员
案例号 月份
聚类
距离 d i m e n s i o n 1 1 1 .000 2 2 2 .000 3 3 3 .000 4 4 4 .208 5 6 4 .258 6 8 4 .312 7 10 4 .194 8 12 5 .297 9
15
5
.245
010185.065
11245.070
12305.112
13365.045
14425.119
15485.051
16545.103
17605.166
18665.074
19725.183
20...
21...
22...
23...
24...
25...
最终聚类中心
聚类
12345
Zscore(身高月平均增长率)3.5678
1
1.3988
3
.66153.02859-.4785
5
Zscore(体重月平均增长率)3.8115
1.1660
3
.35959-.1908
4
-.3811
5
Zscore(胸围月平均增长率)3.6923
6
1.3260
6
.58861-.2025
5
-.3997
4
Zscore(坐高月平均增长率)3.4052
9
1.9482
6
.14212-.0110
6
-.4542
9
最终聚类中心间的距离
聚类12345
1 4.407 6.3757.4428.099
2 4.407 2.236 3.146 3.830
3 6.375 2.236 1.163 1.784
47.442 3.146 1.163.727
58.099 3.830 1.784.727
ANOVA
聚类误差
F Sig.
均方df均方df
每个聚类中的案例

聚类1 1.000
2 1.000
3 1.000
4 4.000
512.000有效19.000缺失 6.000
3.线性回归
研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为回归分析。

根据自变量的个数,分为一元线性回归和多元线性回归。

3.1一元线性回归
原数据
输入/移去的变量b
模型输入的变
量移去的
变量方法
1咖啡类饮
料销售量,
固体冲泡
饮料销售
量, 茶饮
料销售量,
碳酸饮料
销售量a .输入
a. 已输入所有请求的变量。

b. 因变量: 果汁销售量
模型汇总
模型
R R 方调整 R

标准估计
的误差
1.997a.994.99
2.44012
a. 预测变量: (常量), 咖啡类饮料销售
量, 固体冲泡饮料销售量, 茶饮料销售
量, 碳酸饮料销售量。

Anova b
模型平方和df均方F Sig.
1回归338.05
6484.514436.30
6
.000a
残差 1.93710.194
总计339.99
3
14
a. 预测变量: (常量), 咖啡类饮料销售量, 固体冲泡饮料销售量, 茶饮料销售量, 碳酸饮料销售量。

b. 因变量: 果汁销售量
3.2多元线性回归原数据
输出结果:
输入/移去的变量b
模型输入的
变量移去的
变量方法
1X4, X1,
X2, X3a
.输入a. 已输入所有请求的变量。

输入/移去的变量b
模型输入的
变量移去的
变量方法
1X4, X1,
X2, X3a
.输入
a. 已输入所有请求的变量。

b. 因变量: Y
模型汇总b
模型
R R 方调整 R

标准估计
的误差
1.894a.799.726.619
a. 预测变量: (常量), X4, X1, X2, X3。

b. 因变量: Y
共线性诊断a
模型维数
特征值条件索

方差比例
(常量)X1X2X3X4
11 4.538 1.000.01.01.00.00.00
2.218 4.558.08.30.0
3.11.01
3.114 6.30
4.12.22.19.00.39
4.0927.013.67.39.07.01.19
5.03711.020.12.08.71.87.41
a. 因变量: Y
残差统计量a
极小值极大值均值标准
偏差N
预测值 1.02 4.62 2.25 1.05816残差-.743.981.000.53016标准预
测值
-1.164 2.245.000 1.00016
标准残

-1.200 1.583.000.85616 a. 因变量: Y。

相关主题