当前位置:文档之家› 判别分析实验报告 SPSS

判别分析实验报告 SPSS

一、实验目的及要求:1、目的用SPSS软件实现判别分析及其应用。

2、内容及要求用SPSS对实验数据利用Fisher判别法和贝叶斯判别法,建立判别函数并判定宿州、广安等13个地级市分别属于哪个管理水平类型。

二、仪器用具:三、实验方法与步骤:准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS 数据文件中,同时,由于只有当被解释变量是属性变量而解释变量是度量变量时,判别分析才适用,所以将城市管理的7个效率指数变量的变量类型改为“数值(N)”,度量标准改为“度量(S)”,以备接下来的分析。

四、实验结果与数据处理:表1 组均值的均等性的检验Wilks 的 Lambda F df1 df2 Sig.综合效率标准指数.582 23.022 2 64 .000 经济效率标准指数.406 46.903 2 64 .000 结构效率标准指数.954 1.560 2 64 .218 社会效率标准指数.796 8.225 2 64 .001 人员效率标准指数.342 61.645 2 64 .000 发展效率标准指数.308 71.850 2 64 .000 环境效率标准指数.913 3.054 2 64 .054表1是对各组均值是否相等的检验,由该表可以看出,在0.05的显著性水平上我们不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设,即认为除了结构效率标准指数和环境效率标准指数外,其余五个标准指数在三组的均值是有显著差异的。

表2 对数行列式group 秩对数行列式1 6 -33.4102 6 -33.1773 6 -40.584汇聚的组内 6 -32.308 打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。

表3 检验结果箱的 M 140.196F 近似。

2.498df1 42df2 1990.001Sig. .000 对相等总体协方差矩阵的零假设进行检验。

以上是对各组协方差矩阵是否相等的Box’M检验,表2反映协方差矩阵的秩和行列式的对数值。

由行列式的值可以看出,协方差矩阵不是病态矩阵。

表3是对各总体协方差阵是否相等的统计检验,由F值及其显著水平,在0.05的显著性水平下拒绝原假设,认为各总体协方差阵不相等。

1)Fisher判别法:图一图二表4 特征值函数特征值方差的 % 累积 % 正则相关性1 3.763a75.0 75.0 .8892 1.257a25.0 100.0 .746a. 分析中使用了前 2 个典型判别式函数。

表5 Wilks 的 Lambda函数检验Wilks 的 Lambda 卡方df Sig.1 到2 .093 146.042 12 .0002 .443 50.053 5 .000表4反映了判别函数的特征值、解释方差的比例和典型相关系数。

第一判别函数解释了75%的方差,第二判别函数解释了25%的方差,它们两个判别函数解释了全部方差。

表5是对两个判别函数的显著性检验,由Wilks’Lambda检验,认为两个判别函数在0.05的显著性水平上是显著的。

表6 标准化的典型判别式函数系数函数1 2综合效率标准指数-.228 -.578 经济效率标准指数.566 .404 结构效率标准指数.097 .472 社会效率标准指数.378 .233人员效率标准指数-.328 1.099 发展效率标准指数.621 .675表7 结构矩阵函数1 2发展效率标准指数.752*.305 经济效率标准指数.611*.222 综合效率标准指数.426*.170 社会效率标准指数.261*-.001 环境效率标准指数a.141*-.129 人员效率标准指数-.547 .797*结构效率标准指数.070 -.156*判别变量和标准化典型判别式函数之间的汇聚组间相关性按函数内相关性的绝对大小排序的变量。

*. 每个变量和任意判别式函数间最大的绝对相关性a. 该变量不在分析中使用。

表6为标准化的判别函数,表7为结构矩阵,即判别载荷。

由判别权重和判别载荷可以看出发展效率标准指数、经济效率标准指数对判别函数1的贡献较大,而人员效率标准指数对判别函数2的贡献较大。

表8 典型判别式函数系数函数1 2综合效率标准指数-5.216 -13.231 经济效率标准指数 5.168 3.688 结构效率标准指数.999 4.848 社会效率标准指数 4.877 3.011 人员效率标准指数-3.319 11.138 发展效率标准指数7.145 7.774 (常量) -1.363 -6.424 非标准化系数表9 组质心处的函数group 函数1 20 1 -.210 -.7302 3.964 1.2633 -2.725 1.905在组均值处评估的非标准化典型判别式函数表8为非标准化的判别函数,我们可以根据这个判别函数计算每个观测的判别Z 得分。

表9反映判别函数在各组的重心。

根据结果,判别函数在group=1这一组的重心为(-0.210,-0.730),在group=2这一组的重心为(3.964,1.263),在group=3这一组的重心为(-2.725,1.905)。

这样,我们就可以根据每个观测的判别Z得分将观测进行分类。

表11 分类结果b,cgroup 预测组成员合计1 2 3初始计数 1 46 0 0 462 0 10 0 103 2 0 9 11未分组的案例 6 3 3 12 % 1 100.0 .0 .0 100.02 .0 100.0 .0 100.03 18.2 .0 81.8 100.0未分组的案例50.0 25.0 25.0 100.0 交叉验证a计数 1 45 0 1 462 1 9 0 103 2 0 9 11% 1 97.8 .0 2.2 100.02 10.0 90.0 .0 100.03 18.2 .0 81.8 100.0a. 仅对分析中的案例进行交叉验证。

在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。

b. 已对初始分组案例中的 97.0% 个进行了正确分类。

c. 已对交叉验证分组案例中的 94.0% 个进行了正确分类。

表10为各组的先验概率,在分类选项中选择的是所有组的先验概率相等。

表11为分类矩阵表,这里交叉验证是采用“留一个在外”的原则,即每个城市是通过除了这个城市以外的其他城市推导出来的判别函数来分类的。

由该表可以看出,通过判别函数预测,有65个城市是分类正确的,其中,group=1组46个城市全部被判对,group=2组的10个城市也全部被判对,group=3组11个城市中有9个被判对,即有97%的原始城市被判对。

在交叉验证中,三组中分别有45、9、9个城市被判对,交叉验证有94%的城市被判对。

图三图三为分类结果图,从图中可以看到第2组与第3组可以很清晰地分开,与第1组也能分开,而第3组和第1组存在重合区域,即存在误判。

同时,根据对待判城市的判别可以看出:在13个待判城市中,宿州、广安、河地被判到了第3组,佛山、苏州、东营被判到了第2组,咸阳、盘锦、汉中、保定、宝鸡、衡阳被判到了第1组,而以纯由于只有环境效率标准指数的值,其他变量值确实,系统未对其进行判别。

2)贝叶斯判别法:图四图五贝叶斯判别法输出的结果与Fisher判别法很大程度上是一致的,这里不再列出。

表12 组的先验概率group先验用于分析的案例未加权的已加权的0 1 .687 46 46.0002 .149 10 10.0003 .164 11 11.000 合计 1.000 67 67.000表13 分类函数系数group1 2 3综合效率标准指数-89.225 -137.370 -110.980 经济效率标准指数18.318 47.236 15.041 结构效率标准指数112.414 126.246 122.679 社会效率标准指数61.509 87.864 57.179 人员效率标准指数77.419 85.768 115.125 发展效率标准指数57.663 102.980 60.184 (常量) -46.457 -74.840 -66.632 Fisher 的线性判别式函数表12为各族的先验概率,在分组选项中选择的是“根据组大小计算”。

表13展示了每组的分类函数,也称费歇线性判别函数,由表中的结果可以说明:group=1这一组的分类函数为:f=- 46.457-89.225综合效率标准指数+18.318经济效率标准指数1+112.414结构效率标准指数+61.509社会效率标准指数+77.419人员效率标准指数+57.663发展效率标准指数其他两组的分类函数同样可以写出,我们可以根据每个城市在各组的分类函数值然后将城市分类到较大的分类函数值中。

表14为贝叶斯判别的分类结果,其交叉验证有95.5%的城市被判对,这一概率比Fisher判别要高。

表14 分类结果b,cgroup 预测组成员合计1 2 3初始计数 1 46 0 0 462 0 10 0 103 2 0 9 11未分组的案例 6 3 3 12 % 1 100.0 .0 .0 100.02 .0 100.0 .0 100.03 18.2 .0 81.8 100.0未分组的案例50.0 25.0 25.0 100.0 交叉验证a计数 1 46 0 0 462 1 9 0 103 2 0 9 11% 1 100.0 .0 .0 100.02 10.0 90.0 .0 100.03 18.2 .0 81.8 100.0a. 仅对分析中的案例进行交叉验证。

在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。

b. 已对初始分组案例中的 97.0% 个进行了正确分类。

c. 已对交叉验证分组案例中的 95.5% 个进行了正确分类。

五、讨论与结论(1)由前面的分析我们知道,协方差矩阵并不相等,考虑采用分组协方差矩阵。

在分类中使用协方差矩阵“分组(P)”,其他选择同上,得到分类结果表如下。

分类结果agroup 预测组成员1 2 3合计初始计数 1 44 0 2 462 0 10 0 103 0 0 11 11未分组的案例 6 3 3 12 % 1 95.7 .0 4.3 100.02 .0 100.0 .0 100.03 .0 .0 100.0 100.0未分组的案例50.0 25.0 25.0 100.0a. 已对初始分组案例中的 97.0% 个进行了正确分类。

可以看出这个结果与采用组内协方差矩阵的预测效果没有明显的差别,而且分类结果图与图三也没有很大的差异,因此,可以采用组内协方差矩阵来进行判别。

(2)之前的分析是采用“一起输入自变量”的方法,由表1可知,在0.05的显著性水平上不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设,考虑“使用步进式方法”,最终确定进入分析的变量有3个:经济效率标准指数、人员效率标准指数、发展效率标准指数,上表给出了最终的分类结果,可以看出,在原有数据的所有城市中,有95.5%的城市被判对,在交叉验证中有92.5%的城市被判对。

相关主题