当前位置:文档之家› 判别分析案例

判别分析案例

25
结果分析——Fisher判别法
S ta ndar di zed Ca noni ca l D is cr im inant Func ti on Coeffici ents
企业规模 服务 雇员工资比例 利润增长 市场份额 市场份额增长 流动资金比例 资金周转速度
Function 1
.415 .433 .365 - .334 .457 - .355 - .019 - .435
2 .065 .127 .426 .541 .369 .634 .285 - .193
标准化典型 判别函数系数
需要注意的是:这是标准化 后的判别函数,若要将变量 带入计算判别分,必须将变 量进行标准化处理(即减均 值除以标准差)。
➢得到2个标准化典型判别方程:
y 1 0 . 4 x 1 0 . 1 4 x 2 0 5 . 3 3 x 3 0 3 . 6 3 x 4 0 5 . 3 4 x 5 0 4 . 5 3 x 6 0 7 . 5 0 x 7 0 5 . 1 4 x 8 9 3 y 2 0 . 0 x 1 0 . 6 1 x 2 0 5 2 . 4 x 3 0 7 . 2 5 x 4 0 6 . 4 3 x 5 0 1 . 6 6 x 6 0 9 . 3 2 x 7 0 4 . 8 1 x 8 5 9
Use Covariance Matrix:使用协方差阵。
Within-groups:组内协方差阵。
Separate-groups:各组协方差阵。
A
20
SPSS实现——Classify模块
Plots:判别图。
Combined-groups:各类共同输出在一幅散点图中。
Separate-groups:每类单独输出一幅散点图。
Fisher’s:Fisher函数系数——Bayes判别函数系数。 Unstandardized:非标准化函数A 系数——Fisher判别函数系数18。
SPSS实现——Statistics模块
选择Means 进行均数估计
选择ANOVAs进行 各组均值相等检验
选择Box’s M 进行各组协方 差阵相等检验
Tests null hypothesis of equal population covariance matrices.
说明拒绝协方差矩 阵相等的假设,即 不能认为各组间协 方差矩阵相等。
A
从一些统计实践的结 果来看,很少有碰到 检验不显著的情况。 而在一些实践中,比 如线性判别分析,即 使方差-协方差结构 不相等,对于结果的 影响也不会有非常大 的影响。
A
7
大纲
disc.sav, disc.txt
SPSS 实现
数据 介绍
结果 分析
R语言 实现
A
8
数据介绍——disc.sav
• 数据来源:吴喜之——《统计学:从数据到 结论》。
• 数据介绍:某专家编出一套打分体系来描绘 企业的状况。该体系对每个企业的一些指标 (变量)进行评分。共有8个指标,如下页 表格所示。
A
26
结果分析——Fisher判别法
Structu re Matrix
Function
雇员工资比例 企业规模 服务 资金周转速度 市场份额 流动资金比例 市场份额增长 利润增长
1 .413* .400* .381* -.332* .329* -.217* -.311 -.326
2 .343 -.007 .068 -.314 .219 .146 .618* .499*
SPSS实现——数据编辑
Variable View → “Group”变量Decimals:“2” → “0”; Label:添加变量名称,便于识别; “Group”变量Value:添加组别。
A
13
SPSS实现——数据分析
Analyze → Classify → Discriminant
A
14
SPSS实现——模块介绍
Use stepwise method:逐步判别法。按自变量贡献大小, 逐个引入和剔出变量,直到没有新的有显著作用的自变量 可以引入,也没有无显著作用的自变量可以从方程内删除 为止。选此项后,激活Method按钮。
Select Variable:挑选观察单位。框内选入变量后(不能选 入分类变量和自变量中已选入的变量),Value按钮被激 活,填入数值。自己符合该数值的的观察单位才参与判别 分析;若不选此项,则所有观察单位都参与判别分析。
A
6
逐步判别法
• 逐步判别法就是在前面的方法中加入变量选 择功能。有时,一些变量对于判别没有什么 作用,为了得到对判别最合适的变量,可以 使用逐步判别。
• 逐步判别的思想是先用少数变量进行判别, 然后一边判别,一边引进判别能力最强的变 量,同时淘汰判别能力不强的的变量。
• 主要利用一些检验来判断变量的判别能力。
Pooled within-groups corr elations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within fun ction.
Casewise result:每个观察单位判别分析后所属类别。
Limit cases to first []:前若干观察单位判别分析后所属类别。
Summary table:判别符合率表。
Leave-one-out classification:以剔出某观察单位所建立的判别 函数判别该观察单位所属类别。
Matrices:矩阵
Within-groups correlation:合并组内相关阵。 Within-groups covariance:合并组内协方差阵。 Separate-groups covariance:各组协方差阵。 Total covariance:总协方差阵。
Function Coefficients:函数系数。
Territorial map:分类区域图。
Replace missing values with mean:用均数替代缺失值。
选择以样本量百 分比为先验概率
类别显示在 同一散点图中
显示每个单位判别 分析后所属类别
显示判别符合率表
以剔出某观察单位所建立的判别函数判别该观察单位所属类别
A
21
SPSS实现——Save模块
A
10
group 表示类别
数据展示
8个用来建立 判别标准的变量
•该数据disc.sav共有90个样本,其中30个属于
上升型,30个属于稳定性,30属于下降型。这
个已知类别的数据称为一个“训练样本”。
A
11
SPSS实现——数据读入
File → Open → Data → “Disc.sav”
A
12
公司
徽标
多元统计分析——判别分析
统计 研一 苏旸 2007100196
A
1
判别分析——把对象归到已知类中
• 人们常说: ——“像诸葛亮那么神机妙算” ——“像泰山那么稳固” ——“像钻石那么坚硬”
• 一些判别标准都是有原型的,虽然这些判 别的标准并不那么精确或严格,但大都是 根据一些现有的模型得到的。
利润增长
.256 126.415
市场份额
.256 126.148
市场份额增长 .271 117.063
流动资金比例 .441 55.040
资金周转速度 .252 128.913
d f1 2 2 2 2 2 2 2 2
d f2 87 87 87 87 87 87 87 87
Sig . .000 .000 .000 .000 .000 .000 .000 .000
A
2
判别分析的方法
• 距离判别法 • Fisher判别法 • Bayes判别法 • 逐步判别法
A
3
距离判别法
• 假设有两个总体G1和G2, 如果能够定义点x 到它们的距离D(x,G1)和D(x,G2), 则
①如果D(x,G1) < D(x,G2),则 x∈G1 ②如果D(x,G2) < D(x,G1),则 x∈G2 ③如果D(x,G1) = D(x,G2),则待判。
Grouping Variable:选入分类变量“Group”,Define Range 被激活。点击弹出Range对话框,分别输入分类变量最小 值和最大值,本例为“1”和“3”。
Independents:选入自变量。本例选入变量“is—cs”。
Enter independents together:所有自变量同时进入方程。
• 距离判别法的不足之处:
①判别方法与总体各自出现的的概率大小无 关;
②判别方法与错判之后所造成的损失无关。
A
4
Fisher判别法
• 所谓Fisher判别法,就是一种先投影的方 法,把高维空间中的点向低维空间进行投 影。
• 主要思想是通过将多维数据投影到某个合 适的方向上。而投影的原则是将总体与总 体之间尽可能的分开,然后选择合适的判 别规则,进行分类判别。
λ统计量在0-1之间。 越接近0组间差异越 显著;越接近1组间
差异越不显著。
说明在3类企业间, 各变量均有显著差异
A
24
结果分析
各组协方差阵 相等的检验
T est R esults
Box's M F

Approx. df1 df2 Sig.
207. 17 5 2.498 72
21089.679 .000
Save:存为新变量。
Predicted group membership:预测观察单位所属类别。 Discriminant scores:判别分。 Probabilities of group membership:观察单位属于某一类
相关主题