当前位置：文档之家› 医学统计学第十八章判别分析

医学统计学第十八章判别分析

（18-5）（18-6）
例18-1 收集了22例某病患者的三
个指标（X1，X2，X3）的资料列于表181，其中前期患者（A）类12例，晚期患者（B）类10例。试作判别分析。
表18-1
类别编号
A
1
A
2
A
3
A
4
A
5
A
6
A
7
A
8
A
9
A
10
A
11
A
12
B
13
B
14
B
15
B
16
B
17
B
18
B
19
B
20
(A j
)
,
X
(B) j
分别为
X
i和X
j
于
A
类和
B
类的观察值。
2．判别规则建立判别函数后，按公式（18-1）逐例计算判别函数值Zi ，进一步求Zi 的两类均数 ZA 、 ZB 与总均数 Z ，按下式计算判别界值:
判别规则：
Zc
ZA
2
ZB
ZZii
Zc , Zc ,
Zi
Z
，
c
判为A类判为B类判为任意一类
判别函数为 Z 0.070 X 1 0.225 X 2 0.318 X 3 。
逐例计算判别函数值Zi 列于表 18-1 中的 Z 列，同时计算出 Z A 1.428 、Z B 1.722 与总均数Z 0.004 。
（3）确定界值，进行两类判别: 按公式（ 18-5 ）计算 Zc (1.428 1.722) 2 0.147 ，将 Zi 0.147 判为 A 类，Zi 0.147 判为 B 类。判别结果列于表 18-1 的最后一列，有 4 例错判。
二、判别效果的评价用误判概率P衡量
方法：回顾性：样本回代。必须做，但效果差。
回顾性误判概率估计往往夸大判别效果。
前瞻性：验证样本。刀切法：步骤 ①顺序剔除一个样品，用余下的 N-1 个样品建立判别函数；
②用判别函数判别剔除的样品； ③重复上两步 N 次, 计算误判概率。此法优点：充分利用了样本的信息建立和验证判别函数。本例刀切法误判概率估计值为 6 22 27.3% 。要求判别函数的误判概率小于 0.1 或 0.2 才有应用价值。
第十八章
判别分析
Discriminant Analysis
Content
• Fisher discriminant analysis • Maximum likelihood method • Bayes formula discriminant analysis • Bayes discriminant analysis • Stepwise discriminant analysis
▪ 用途：解释和预报（主要用于计量诊断）。 ▪ 分类（经典）： Fisher判别和Bayes判别。
按资料类型分：
1. 计量资料判别分析。目的是作出以定量指标判别个体属性分类或等级的判别函数。
2. 计数资料判别分析。目的是作出以定性或等级指标判别个体属性分类或等级的概率公式。
按方法名分
➢ 1. Fisher判别 ➢ 2. 最大似然判别法 ➢ 3. Bayes公式判别法 ➢ 4. Bayes判别 ➢ 5. 逐步判别
个
指标的均数 ( j 1,2, , m) ；
Sij 是 X1, X 2 ,L , X m 的合并协方差阵的元素。
Sij
(
X
( i
A
)
X
( i
A
)
)(
X
( j
A
)
X
(A j
)
)
(
X
(B) i
nA nB 2
X
(B) i
))(
X
(B) j
X
(B) j
)
(18-4)
式中
X
(A) i
,
X (B) i
,
X
2020/4/23
医学统计学
讲述内容
第一节 Fisher判别第二节最大似然判别法第三节 Bayes公式判别法第四节 Bayes判别第五节逐步判别第六节判别分析中应注意的问题
▪ 目的：作出以多个判别指标判别个体分类的
判别函数或概率公式。
▪ 资料：个体分两类或多类，判别指标全部为
数值变量或全部为分类变量。
1.39
A
0
-2
2
-1.09
B
-10
-2
0
0.25
A
9
-5
1
-2.07
B
2
-1
-1
-0.05
A
17
-6
-1
-2.22
B
8
-2
1
-1.33
B
17
-9
1
-3.53
B
0
-11
3
-3.43
B
-9
-20
3
-4.82
B
-7
-2
3
-0.91
B
-9
6
0
1.98
A
12
0
0
-0.84 B
（1）计算变量的类均数及类间均值差Dj，计算结果列于表18-2。
B
21
B
22
22例患者三项指标观察结果（Zc=-0.147）
X1
观察值
X2
X3
Z
Fisher 判别结果
23
8
0
0.19
A
-1
9
-2
2.73
A
-10
5
0
1.83
A
-7
-2
1
-0.28
B
-11
3
-4
2.72
A
-10
3
-1
1.69
A
25
9
-2
0.91
A
-19
12
-3
4.98
A
9
8
-2
1.81
A
-25
-3
-1
表18-2 变量的均数及类间均值差
类别例数
X1
X2
X3
A
12
－3
4
－1
B
10
4
－5
1
类间均值差D j
－7
9
－2
（2）计算合并协方差矩阵: 按公式（18-4），例如：
S11
[(23 3)2
(1 3)2
(10 3)2 ] [(9 4)2 12 10 2
(2 4)2
(12 4)2 ]
判别系数 C 可通过对λ求导，由下列方程组解出
S11C1 S12C2 L S1mCm D1
S21C1
S22C2
L L
S2mCm D2
Sm1C1 Sm2C2 L SmmCm Dm
(18-3)
式中 Dj
X (A) j
X (B) j
，X(ABiblioteka j,X (B) j
分别是
A
类和
B
类第
j
175.3
得到合并协方差阵
175.3 20.3 2.3
S
20.3
38.2
5.8
2.3 5.8 2.7
代入公式（18-3）得
175.3C1 20.3C2 2.3C3 7
20.3C1 38.2C2 5.8C3
9
2.3C1 5.8C2 2.7C3 2
解此正规方程得 C1 0.070 ，C2 0.225 ，C3 0.318
第一节 Fisher判别
适用于指标为定量指标的两类判别（或多类判别）
一、两类判别
1. Fisher判别的原理
已知 A、B 两类观察对象，A 类有 nA 例， B 类有 nB 例，分别记录了 X1, X 2 , , X m 个
观察指标，称为判别指标或变量。Fisher 判别法就是找出一个线性组合
Z C1X1 C2 X2 L Cm X m
(18-1)
Fisher 准则：使得综合指标 Z 在 A 类的均数 ZA 与在 B 类的均数 ZB 的差异 ZA ZB 尽可能大，而两类内综合指标 Z 的变异 SA2 SB2 尽可能小，即使得达到最大。
ZA ZB SA2 SB2
(18-2)

e商务文档

医学统计学第十八章判别分析

相关文档推荐：