学生实验报告学院:课程名称:多元统计分析专业班级:姓名:学号:学生实验报告一、实验目的及要求:1、目的熟悉SPSS统计软件,学会在统计软件SPSS中进行判别分析,并通过判别分析输出结果图,再进行判别分析。
根据输出结果,把未分组的判给距离相近那组。
2、内容及要求⑴熟悉spss软件有关判别分析的操作;⑵利用spss软件分析判别分析课后练习第六题,判定待判组的类别归属;⑶输出并解释分析结果并完成实验报告。
二、仪器用具:三、实验方法与步骤:步骤一:将数据复制到SPSS中,经过编辑后形成某地区人口死亡状况的数据集,如图1所示。
图1 某地区人口死亡状况的观测数据步骤二:根据要求,采用系统聚类方法,在SPSS中选择分析-分类-判别分析如图2。
图2 判别分析步骤三:进行判别分析,将X1到X6全部选入自变量中,分组变量为组别,如图图3 判别分析选项框步骤四:在统计量选项框中选择均值,单变量,Box’s M 等,如图4;分类选项中勾选个案、摘要等,如图5。
图4 统计量选项框图5 分类选项框四、实验结果与数据处理:1.检验各组的描述统计量和对各组均值是否相等:表1 Analysis Case Processing SummaryUnweighted Cases NPercentValid 15 78.9 ExcludedMissing or out-of-range group codes421.1At least one missing discriminating variable 0.0Both missing orout-of-range group codes and at least one missing discriminating variable 0.0Total4 21.1 Total19100.0表1表2平上拒绝X4与X5在三组的均值相等的假设,即认为变量X4、X5在三组的均值是有显著差异的。
2. 典型判别函数:表4 Wilks' LambdaTest of Function(s) Wilks' LambdaChi-squaredfSig. 1 through 2.010 43.948 12 .000 2.5914.9995.416由表3可以得出:第一判别函数解释了98.8%的方差,第二判别函数解释了1.2%的方差,两个判别函数解释了全部的方差。
表4是对两个判别函数的显著性检验,由Wilkins’ Lambda检验,在0.05的显著性水平上,根据P值可以得到,第一个判别函数是显著的,第二个判别函数是不显著的。
3. 判别函数、判别载荷和各组的重心:表5 Standardized Canonical Discriminant Function CoefficientsFunction1 2X1 -17.046 -7.677X2 14.757 9.870X3 -1.306 -.513X4 6.381 -.666X5 1.332 .710X6 4.315 1.833表6 Structure MatrixFunction1 2X1 .007*-.002X5 .280 -.394*X4 .145 -.201*X3 .096 .104*X2 .007 .103*X6 -.035 .092*表7 Canonical Discriminant Function CoefficientsFunction1 2X1 -1.950 -.878X2 1.748 1.169X3 -.930 -.365X4 .825 -.086X5 .102 .054X6 1.662 .706(Constant) -78.896 -30.330表8 Functions at Group Centroids组别Function1 21 -2.647 1.0132 9.444 -.2593 -6.797 -.754表5是标准化的判别函数,表示为:Y1=-17.046X1+14.757X2-1.306X3+6.381X4+1.332X5+4.315X6Y2=-7.677X1+9.870X2-0.531X3-0.666X4+0.710X5+1.833X6表6为结构矩阵,即判别载荷,表四是反映判别函数在各组的重心表7是非标准化的判别函数,表示为:Y1=-78.896-1.950X1+1.748X2-0.930X3+0.825X4+0.102X5+1.662X6Y2=-30.330-0.878X1+1.169X2-0.365X3-0.086X4+0.054X5+0.706X64.分类的统计结果:表8 Classification Function Coefficients组别1 2 3X1 -159.015 -181.479 -149.370X2 168.068 187.715 158.749X3 -98.413 -109.195 -93.908X4 58.217 68.296 54.948X5 11.702 12.862 11.185X6 202.770 221.972 194.625(Constant) -5628.382 -6584.377 -5266.780Fisher's linear discriminant functions表8是每组的分类函数,也称费歇线性判别函数,三组的分类函数表示为:Y1=-5628.382-159.015X1+168.068X2-98.413X3+58.217X4+11.702X5+202.770X6 Y2=-6584.377-181.479X1+187.715X2-109.195X3-68.296X4+12.862X5+221.972X6 Y3=-5266.780-149.370X1+158.749X2-93.908X3+54.948X4+11.185X5+194.625X6 可以根据计算每个观测在各组的分类函数值,将观测分类到较大的分类函数值中。
表9为分类矩阵表,通过判别函数的预测,根据原数据的所属组关系,3组观测全部被判对,未分组的变量中有一个待判样品判给第一组,有一个待判样品判给第二组,有两个待判样品判给第三组。
在交叉验证中,第一组5个样品全部被判对,图6 分类结果根据上图6分类结果可以看出:第二组样品与第一组样品和第三组样品可以很Casewise StatisticsCaseNumber ActualGroupHighest Group Second Highest Group Discriminant ScoresPredictedGroupP(D>d | G=g)P(G=g| D=d)SquaredMahalanobisDistance toCentroid GroupP(G=g| D=d)SquaredMahalanobisDistance toCentroidFunction1Function2 p dfO R I G I N A l 1 1 1 .846 2 1.000 .334 3 .000 25.690 -2.197 1.3752 1 1 .876 2 1.000 .2663 .000 24.876 -2.292 1.3863 1 1 .942 2 1.000 .119 3 .000 20.463 -2.782 1.3304 1 1 .756 2 .999 .561 3 .001 14.211 -3.289 .6285 1 1 .800 2 1.000 .445 3 .000 18.184 -2.677 .3466 2 2 .789 2 1.000 .474 1 .000 159.052 9.939 .2197 2 2 .659 2 1.000 .835 1 .000 128.948 8.594 -.5948 2 2 .050 2 1.000 5.990 1 .000 181.077 10.332 -2.5409 2 2 .091 2 1.000 4.786 1 .000 127.694 8.627 1.77110 2 2 .955 2 1.000 .092 1 .000 154.498 9.728 -.15111 3 3 .936 2 1.000 .132 1 .000 20.106 -6.901 -.40612 3 3 .836 2 1.000 .359 1 .000 25.430 -7.393 -.69313 3 3 .076 2 1.000 5.152 1 .000 45.937 -8.834 -1.75614 3 3 .178 2 .905 3.457 1 .095 7.964 -4.942 -.63015 3 3 .607 2 .997 .998 1 .003 12.361 -5.914 -.28616 ungrouped 3 .000 2 1.000 395.903 1 .000 587.379 -21.903 -13.70417 ungrouped 1 .745 2 .999 .588 3 .001 14.106 -3.393 .83418 ungrouped 2 .000 2 1.000 31.237 1 .000 295.309 14.502 2.12019 ungrouped 3 .310 2 1.000 2.344 1 .000 35.657 -7.914 -1.801C R O S S - v a l i d a t e d a 1 1 1 .966 6 1.000 1.398 3 .000 25.2672 1 1 .939 6 1.000 1.7763 .000 24.6943 1 1 .982 6 1.000 1.097 3 .000 19.3514 1 1 .933 6 .998 1.853 3 .002 14.0845 1 1 .2786 .998 7.485 3 .002 20.0036 2 2 .000 6 1.000 44.990 1 .000 218.2357 2 1**.000 6 1.000 126.778 2 .000 162.9218 2 2 .000 6 1.000 50.095 1 .000 366.0469 2 2 .000 6 1.000 50.786 1 .000 130.35410 2 2 .000 6 1.000 240.321 1 .000 420.03311 3 3 .898 6 1.000 2.224 1 .000 19.68312 3 3 .387 6 1.000 6.328 1 .000 29.80813 3 3 .000 6 1.000 31.587 1 .000 133.55314 3 1**.088 6 1.000 11.010 3 .000 45.428根据上表Casewise Statistics结果可以得出:将待判样品1(第16行)判给第三组,将待判样品2(第17行)判给第一组,将待判样品3(第18行)判给第二组,将待判样品4(第18行)判给第三组。