当前位置:文档之家› 医学统计学第十八章判别分析

医学统计学第十八章判别分析


(18-5) (18-6)
例18-1 收集了22例某病患者的三
个指标(X1,X2,X3)的资料列于表181,其中前期患者(A)类12例,晚期患 者(B)类10例。试作判别分析。
表18-1
类别 编号
A
1
A
2
A
3
A
4
A
5
A
6
A
7
A
8
A
9
A
10
A
11
A
12
B
13
B
14
B
15
B
16
B
17
B
18
B
19
B
20
(A j
)
,
X
(B) j
分别为
X
i和X
j

A
类和
B
类的观察值。
2.判别规则 建立判别函数后,按公式(18-1) 逐例计算判别函数值Zi ,进一步求Zi 的两类均数 ZA 、 ZB 与总均数 Z ,按下式计算判别界值:
判别规则:
Zc
ZA
2
ZB
ZZii
Zc , Zc ,
Zi
Z

c
判为A类 判为B类 判为任意一类
判别函数为 Z 0.070 X 1 0.225 X 2 0.318 X 3 。
逐例计算判别函数值Zi 列于表 18-1 中的 Z 列,同 时计算出 Z A 1.428 、Z B 1.722 与总均数Z 0.004 。
(3)确定界值,进行两类判别: 按公式 ( 18-5 ) 计 算 Zc (1.428 1.722) 2 0.147 , 将 Zi 0.147 判为 A 类,Zi 0.147 判为 B 类。判 别结果列于表 18-1 的最后一列,有 4 例错判。
二、判别效果的评价 用误判概率P衡量
方法:回顾性:样本回代。必须做,但效果差。
回顾性误判概率估计往往夸大判别效果。
前瞻性:验证样本。 刀切法: 步骤 ①顺序剔除一个样品,用余下的 N-1 个样品建立 判别函数;
②用判别函数判别剔除的样品; ③重复上两步 N 次, 计算误判概率。 此法优点:充分利用了样本的信息建立和验证判别函 数。本例刀切法误判概率估计值为 6 22 27.3% 。 要求判别函数的误判概率小于 0.1 或 0.2 才有应用价值。
第十八章
判别分析
Discriminant Analysis
Content
• Fisher discriminant analysis • Maximum likelihood method • Bayes formula discriminant analysis • Bayes discriminant analysis • Stepwise discriminant analysis
▪ 用途:解释和预报(主要用于计量诊断)。 ▪ 分类(经典): Fisher判别和Bayes判别。
按资料类型分:
1. 计量资料判别分析。目的是作出以定量指标 判别个体属性分类或等级的判别函数。
2. 计数资料判别分析。目的是作出以定性或等 级指标判别个体属性分类或等级的概率公式。
按方法名分
➢ 1. Fisher判别 ➢ 2. 最大似然判别法 ➢ 3. Bayes公式判别法 ➢ 4. Bayes判别 ➢ 5. 逐步判别

指标的均数 ( j 1,2, , m) ;
Sij 是 X1, X 2 ,L , X m 的合并协方差阵的元素。
Sij
(
X
( i
A
)
X
( i
A
)
)(
X
( j
A
)
X
(A j
)
)
(
X
(B) i
nA nB 2
X
(B) i
))(
X
(B) j
X
(B) j
)
(18-4)
式中
X
(A) i
,
X (B) i
,
X
2020/4/23
医学统计学
讲述内容
第一节 Fisher判别 第二节 最大似然判别法 第三节 Bayes公式判别法 第四节 Bayes判别 第五节 逐步判别 第六节 判别分析中应注意的问题
▪ 目的:作出以多个判别指标判别个体分类的
判别函数或概率公式。
▪ 资料:个体分两类或多类,判别指标全部为
数值变量或全部为分类变量。
1.39
A
0
-2
2
-1.09
B
-10
-2
0
0.25
A
9
-5
1
-2.07
B
2
-1
-1
-0.05
A
17
-6
-1
-2.22
B
8
-2
1
-1.33
B
17
-9
1
-3.53
B
0
-11
3
-3.43
B
-9
-20
3
-4.82
B
-7
-2
3
-0.91
B
-9
6
0
1.98
A
12
0
0
-0.84 B
(1)计算变量的类均数及类间均值差Dj, 计算结果列于表18-2。
B
21
B
22
22例患者三项指标观察结果(Zc=-0.147)
X1
观察值
X2
X3
Z
Fisher 判别结果
23
8
0
0.19
A
-1
9
-2
2.73
A
-10
5
0
1.83
A
-7
-2
1
-0.28
B
-11
3
-4
2.72
A
-10
3
-1
1.69
A
25
9
-2
0.91
A
-19
12
-3
4.98
A
9
8
-2
1.81
A
-25
-3
-1
表18-2 变量的均数及类间均值差
类别 例数
X1
X2
X3
A
12
-3
4
-1
B
10
4
-5
1
类间均值差D j
-7
9
-2
(2)计算合并协方差矩阵: 按公式(18-4),例如:
S11
[(23 3)2
(1 3)2
(10 3)2 ] [(9 4)2 12 10 2
(2 4)2
(12 4)2 ]
判别系数 C 可通过对λ求导,由下列方程组解出
S11C1 S12C2 L S1mCm D1
S21C1
S22C2
L L
S2mCm D2
Sm1C1 Sm2C2 L SmmCm Dm
(18-3)
式中 Dj
X (A) j
X (B) j
,X(ABiblioteka j,X (B) j
分别是
A
类和
B
类第
j
175.3
得到合并协方差阵
175.3 20.3 2.3
S
20.3
38.2
5.8
2.3 5.8 2.7
代入公式(18-3)得
175.3C1 20.3C2 2.3C3 7
20.3C1 38.2C2 5.8C3
9
2.3C1 5.8C2 2.7C3 2
解此正规方程得 C1 0.070 ,C2 0.225 ,C3 0.318
第一节 Fisher判别
适用于指标为定量指标的两类判别 (或多类判别)
一、两类判别
1. Fisher判别的原理
已知 A、B 两类观察对象,A 类有 nA 例, B 类有 nB 例,分别记录了 X1, X 2 , , X m 个
观察指标,称为判别指标或变量。Fisher 判 别法就是找出一个线性组合
Z C1X1 C2 X2 L Cm X m
(18-1)
Fisher 准则:使得综合指标 Z 在 A 类 的均数 ZA 与在 B 类的均数 ZB 的差异 ZA ZB 尽可能大,而两类内综合指标 Z 的 变异 SA2 SB2 尽可能小,即使得 达到最大。
ZA ZB SA2 SB2
(18-2)
相关主题