当前位置:文档之家› 第十八章 判别分析.ppt

第十八章 判别分析.ppt

软件不能自动实现)。
8
判别分析方法的基本步骤
1.建立判别函数(方程) 2.规定判别(分类)准则
判别新个体为某类 3.评价判别方程的效果
9
第一节 Fisher判别
一 、两类判别
1. Fisher判别(典则判别 canonical discriminant)
用已知类别(A或B)研究对象的x1, x2…… xm指 标,建立判别方程(z):
第十八章 判别分析 (Discriminant Analysis)
分类学是人类认识世界的基础科学。判别 分析是研究事物分类的基本方法,广泛应用 于自然和社会科学各个领域。
第二析内容
* 第一节 Fisher判别 第二节 最大似然判别法 第三节 Bayes公式判别法
*第四节 Bayes判别 *第五节 逐步判别 * 第六节 判别分析中应注意的问题 (补充:SPSS统计软件的操作和结果) *重点:判别分析概念、应用、结果解释、注意 的问题。
2
概述
对事物分类,以便给予不同的处理。 但事物的分类常需要多个指标,判别分析 是通过多变量对事物进行分类方法。
医学中的分类问题: 疾病的预测
s
2 A
sB2
英国统计学家Fisher R A 爵士(1890~1962)
zc1x1c2x2....cm xm
12
通过解下列距阵得到判别系数(c)
S11C1 S12C2 ....S1mCm D1 S21C1 S22C2 ....S2mCm D2
类间 均数 差值
.....
(18-3)
Sm1C1 Sm2C2 ....SmmCm Dm
用误判率评价:
p(A/ B) 判B为 类 A类 的的 例例 数数
p(B/ A)判A为 类 B类的的例例数数
预测病人的预后(好或差),提出早期治疗方法, 降低严重后果。
3
例: 新生儿缺氧缺血性脑病(HIE)预 后(山东某医院,2019年) 判别指标:
生后1 分钟阿氏评分(X1) 、窒息复苏时 间(X2 ) 、惊厥持续天数(X3 ) 、急性期CT 改变(X4) 及治疗3 天后原始反射情况(X5).
求得判别值Z = 77, 以Z > 77 作为预后不 良的标准.
对资料要求: 要求建立方程的观察对象分类(y)已经
明确(用金标准确定),收集建模对象(训 练样本)的m个变量(x)建立判别方程。
7
判别分析建模的方法
根据自变量(x)资料性质:
自变量(x)为计量数据: Fisher判别、Bayes判别(SPSS、SAS
统计软件可实现)。
自变量(x) 为定性数据: 最大似然判别法、Bayes公式判别(统计
18
3.计算判别界值Zc
将各类每个个体的变量值代入判别方程, 得到zi,得到zA和zB的均数.
z 0 .0 7 x 1 0 .2 2 5 x 2 0 .3 1 8 x 3
zA1.42 ,zB 81.722
zczA 2zB1 .42 2 ( 8 1 .7) 2 2 0 .004 预测: 某病人测定了x1、x2、x3值,代 入方程z,计算的z>-0.004,为A类。 19
zc1x1c2x2....cm xm
(18-1)
方程中系数c为判别系数,c1, c2…… cm,
10
Fisher判别的原理
Z
|Z SA
A 2
Z

B
SB2
z1
z2
正常人
冠心病人
11
Fisher方差分析的思想
准则:寻找组间变异(类间均数)/ 组内 变异的比值最大化.
|Z SA
A 2
Z

B
SB2
zA zB
Sij为第i指标和第j个指标的合并协方差
zc1x1c2x2....cm xm
13
2.建立判别规则和判别值(Zc)
zc
zA
zB 2
(18-5)
z i z c 判为A类
z i z c 判为B类
z i z c 判为任意一类
14
例:讲义表18-1 两类疾病 22例患者三项指标观察结果
编号 类别(y) x1
1
A
23
2
A
-1
3
A
-10
x2 x3 80 9 -2 50
13
B
14
B
15
B
9 -5 1 2 -1 - 1 17 -6 - 1
15
计算步骤: 1.计算各类均数和合并(A、B)的协方 差距阵(S)
s11,s12,s13 17.53,20.3,2.3 ss21,s22,s2320.3,38.2,5.8
lx y (xx)y (y)
17
2.解正规方程得出判别系数C
类间
17.53C120.3C2 2.3C3 7
均数 差值
20.3C138.2C2 5.8C3 9
2.3C15.8C2 2.7C3 2
C 1 0 .0,C 7 2 0 .2,2 C 3 5 0 .318
z 0 .0 7 x 1 0 .2 2 5 x 2 0 .3 1 8 x 3
s31,s32,s33 2.3,5.8,2.7
16
变量的合并方差和协方差
s11 (xn A1 A x 1A1)2 (xn B1 B x 1B1)2
s1 2 (xA 1 x n A A 1) x 1 A (2xA 2) (xB 1 xn B 1 B ) x 1 B (2xB 2)
lxx(xx)2
5
事物分类的统计方法
主要有判别分析和聚类分析
判别分析:事物的分类是清楚的,目的是 通过已知分类建立判别函数,预测新的观察 对象所属类别。
聚类分析:事物分类不清楚,分几类不清 楚,目的希望将事物进行分类(探索性研 究)。
6
判别分析的特点
用途:通过数据建立判别方程,对研究事物进 行分类和预测。
例:表18-1 两类疾病 22例患者三项指标预测结果
类别 x1 x2 x3 z值 判别结果
A
23 8 0 0.19
A
A
-1 9 -2 2.73
A
A
-10 5 0 1.83
A
B
9 -5 1 -2.07 B
B
2 -1 -1 -0.05 A
B
17 -6 -1 -2.22 B
z>-0.004,为A类
20
二、判别效果的评价
不良预后:①脑性瘫痪, ②严重智能低下
4
疾病诊断: 对疾病的诊断,确定进一步的治疗。
例:判别分析在糖尿病周围神经病变早期诊断中的应 用(广州南方医院内分泌科,2019年)
管理和经济学上分类: 对研究单位分类,判别所属类别,为管理者
制定政策提供依据。
例: 根据经济指标,人均收入、人均工农产值、人均 消费水平等判断不同地区经济发展程度类型。
相关主题