判别分析 SPSS应用
a. First 2 canonical discriminant functions were used in the analysis.
典则判别函数的特征值(即矩阵W-1B的特征 根 )以及方差贡献。 典则相关系数(Canonical Correlation)。
判别分析结果输出(7)
Wilks' Lambda Test of Function(s) 1 through 2 2 Wilks' Lambda .025 .774 Chi-square 538.950 37.351 df 8 3 Sig. .000 .000
0 0 150
.0 .0 100.0
参与判别分析的观测量数据总结
判别分析结果输出(2)
Group Statistics
分类 刚毛鸢尾花
变色鸢尾花
佛吉尼亚鸢尾花
Total
花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽
花萼长 花萼宽 花瓣长 花瓣宽
单变量方差分析结果:进行假设检验,原假设不同类中 的同变量均值相等。 Wilk的 统计量。 F检验。
判别分析结果输出(4a)
a Covariance Matrices
分类 刚毛鸢尾花
花萼长 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽 花萼长 花萼宽 花瓣长 花瓣宽
SPSS 判别分析和应用
观测量描述统计量 判别函数系数 标准化以及未标准化典则判别函数系数 类内相关矩阵和协方差矩阵 判别函数得分和据此划分的类别 判别函数的判别效果 交叉验证
点击菜单 Analysis→classify→discriminant
Discriminant功能界面-主对话框
变色鸢尾花ห้องสมุดไป่ตู้
佛吉尼亚鸢尾花
,
进一步分析 必要性,挑 选变量?
Total
a. The total covariance matrix has 149 degrees of freedom.
各类协方差矩阵和总协方差矩阵。 除刚毛鸢尾花外,另两种花的花瓣长和花萼长的协方差数 值较大。 总协方差阵中,花瓣长和花萼长的协方差数值较大。
分类统计结果:均值、方差、未加权的 权重和加权的权重。
判别分析结果输出(3)
Tests of Equality of Group Means Wilks' Lambda .397 .598 .059 .071 F 111.847 49.371 1179.052 960.007 df1 2 2 2 2 df2 147 147 147 147 Sig. .000 .000 .000 .000
对话框上部左侧的变量列表中选分析变量,点击钮使 之进入Independents框 对话框上部左侧的变量列表中选分组(类)变量,点击 钮使之进入Group Variable框 Enter independents togther 或 Use Stepwise method:所 选全部参与判别分析 还是 逐步方法挑选变量判别分析 5个功能按钮: 1) Select : 根据标识变量,选择部分数据参与分析 2) Statistics : 指定输出统计量 3) Method : 判别分析方法 4) Classify : 分类参数、图表输出、交叉验证 5) Save : 在数据文件之建立新变量显示输出结果
Tests null hypothesis of equal population covariance matrices.
各类协方差矩阵相等的假设检验:假设各类协方差矩 阵相等。 结果:置信水平为0.000,各类协方差矩阵不相等。
判别分析结果输出(6)
Eigenvalues Function 1 2 Eigenvalue % of Variance 30.419a 99.0 .293a 1.0 Cumulative % 99.0 100.0 Canonical Correlation .984 .476
Mean 50.06 34.28 14.62 2.46 59.36 27.66 42.60 13.26 66.38 29.82 55.60 20.26 58.60 30.59 37.61 11.99
Std. Deviation 3.52 3.79 1.74 1.05 5.16 3.15 4.70 1.98 7.13 3.22 5.54 2.75 8.63 4.36 17.68 7.62
分类使用的协方差阵 输出的统计图
各类先验概率相等; 根据各类样本量计算先验概率,各类先验概率与其样 本量成正比。
对每个观测量输出判别分数、实际类、预测类和后验概率等。 Limit cases to first:指定输出前n个观测量的分类结果。 输出分类小结,给出正确分类的观测量数,错分观测量数和 错分率。 交叉验证的判别分类结果,即所依据的判别函数是由除该观 测量以外的其它观测量导出的。
Valid N (listwise) Unweighted Weighted 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 50 50.000 150 150.000 150 150.000 150 150.000 150 150.000
费歇尔判别系数; 未标准化的判别方程系数。
合并类内相关矩阵; 合并类内协方差矩阵(各类协方差矩阵取平均计算)。 各类的协方差矩阵 总的协方差矩阵。
Classify对话框-分类参数和判别结果
Prior Probabilities:先验概率。 输出窗口中的有关分类结果 缺测值处理办法
Statistics 对话框-指定输出统计量
Descriptives:描述统计量 Function Coefficients:判别函数系数 Matrices:观测量的统计矩阵。
观测量均值; 单变量方差分析检验。原假设各类同一自变量均值相等。 各类协方差矩阵相等的检验。原假设各类协方差矩阵相等。
Wilk的Lambda 统计量:组内离差交叉乘积矩阵行列式与 总离差交叉乘积矩阵行列式比值。对判别函数的有效性 进行检验假设。 两判别函数自由度: (4-1+1)(3-1)=8;(4-2+1)(3- 2)=3
该统计量服从自由度为(m-r+1)(G-r)的 χ2-分布. r 为第几个判别函数,m 为变量数,G 为类数。
判别分析应用实例1—— 全变量分析
数据集:鸢(yuan)尾花的花瓣和花萼 的长宽数据。 一共收集3种鸢(yuan)尾花,每种50个 样本,共150个样本。
判别分析结果输出(1)
Analysis Case Processing Summary Unweighted Cases Valid Excluded Missing or out-of-range group codes At least one missing discriminating variable Both missing or out-of-range group codes and at least one missing discriminating variable Total Total N 150 0 0 Percent 100.0 .0 .0
判别分析结果输出(4b)
a Pooled Within-Groups Matrices
花萼长
Covariance 花萼长
花萼宽
8.767 11.542 5.033 3.145 .471 1.000 .344 .452
花瓣长
16.129 5.033 18.597 4.287 .683 .344 1.000 .486
12.425 9.922 1.636 1.033 26.643 8.288 18.290 5.578 50.812 8.090 28.461 6.409 74.537 -4.683 130.036 53.507
花萼宽
9.922 14.369 1.170 .930 8.288 9.902 8.127 4.049 8.090 10.355 5.804 4.456 -4.683 19.036 -33.056 -12.083
Method对话框- 选择变量的判别分析方法
Wilk’ lambda:每步使得Wilk的统计量最小的变量进入 判别函数( 统计量-判别函数组内离差平方和与组间 离差平方和的比值)。 Unexplained variance:每步使得各类不可解释的方差之 和最小的变量进入判别函数; Mahalanobis’ distance:每步使得两类间最近的马氏距离 最大的变量进入函数; Smallest F ratio:每步使得两类间最小的F值最大的变量 进入函数; Rao’s V:每步使得Rao V统计量产生最大增量的变量进 入判别函数。
指定使用合并类内协方差矩阵进行分析。 指定使用各类协方差矩阵进行分析。
生成一个包括各类的散点图,根据前两个判别函数作图;如果只有一 个判别函数,则输出直方图。 对每类生成一个散点图,根据前两个判别函数作图。但如果只有一个 判别函数,则输出直方图。 生成区域图。即根据函数值把观测量分到各类中去的区域图,把一个 平面划分成与类数相同的区域,每类占据一个区,各类均值在各区中 用星号标注。
合并类内协方差矩阵和相关矩阵:阵中各元素是各类 协方差阵或相关阵中对应元素的均值。 花瓣长和花萼长的协方差值和相关系数值较大。
判别分析结果输出(5)
Test Results Box's M F Approx. df1 df2 Sig. 162.596 7.811 20 77566.75 .000