当前位置:文档之家› 协方差分析(三版)

协方差分析(三版)


估计误差
F (Y Yˆ )2 MS
总变异
35 508150.076 187349.144 75783.356
饲料间
2 383620.127 135607.964 48297.627
白鼠间 误差
11 87586.703 36638.307 19089.116 22 36943.246 15102.873 8399.613
342.9 56.5
356.9 76.0
198.2
9.2
12
12
272.23 37.10
B组
X2
260.3 271.1 214.7 300.1 269.7 307.5 278.9 256.2 240.8 340.7 356.3 199.2
12
Y2
32.0 47.1 36.7 65.0 39.0 37.9 51.5 26.7 41.0 61.3 102.1 8.1
协方差分析的基本步骤
➢1.确定协变量(即未加以控制或难以控制 的因素)
➢2.检验条件是否满足 ➢3.建立因变量Y随协变量X变化的线性回归
关系 ➢4.利用回归关系把协变量X化为相等后再进
行各组Y的修正均数间比较的假设检验
完全随机设计资料的 协方差分析
表13-1 kn对观测值x、y的单向分组资料的 一般形式
28
11.2
9.5
10.7
9.3
9.4
7.8
29
9.6
8.2
10.4
8.7
8.3
6.6
30
8.0
7.2
9.4
8.7
9.2
7.2
若不考虑初始糖化血红蛋白X对Y的影响
H0:μ1=μ2=μ3 H1:μ1、μ2、μ3不等或不全相等
α=0.05
结论:三种治疗组降糖化血红蛋白的效果不同。
如何在扣除或均衡这些不可控制因素的影 响后比较多组均数间的差别,应用协方差分 析。
A饲料
*
Y A 37.10 0.4088(272.23 346.42) 67.43
B饲料
*
Y B 45.70 0.4088(274.62 346.42) 75.05
C饲料
*
Y C 118.74 0.4088(492.40 346.42) 59.06
➢ 6、以修正均数及组内的估计误差平方和分别除以 相应的自由度得到修正均数及组内估计误差均方, 求F值
➢ 7、查F界值表得P值,做出统计推断
➢ 8、多重比较的q检验
例13-1
药物治疗是人为可控制的定性因素,称定性变量 初始糖化血红蛋白是难以控制的定量因素,称协变 量X 3月后的糖化血红蛋白是实验观察指标,称应变量Y
21 2225.36 105.97
饲料+误差 24 420563.373 150710.837 56697.240
23 2689.31
修正均数
2 463.95 231.98 2.19
总变异-白鼠间
(Y
Yˆ )2
l YY
l
2 XY
l XX
(Y Yˆ )2修正均数 (Y Yˆ )2饲料误差 (Y Yˆ )2误差
三组大白鼠的进食量(X, g)与增重(Y, g)
区组
1 2 3 4 5 6 7 8 9 10 11 12
X
nj
j
(Y j )
A组
X1
Y1
256.9 27.0
271.6 41.7
210.2 25.0
300.1 52.0
262.2 14.5
304.4 48.8
272.4 48.0
248.2
9.5
242.8 37.0
表13-3 三组患者治疗前后的糖化血红蛋白含量(%)
第一组
第二组
第三组
X1
Y1
X2
Y2
X3
Y3
1
10.8
9.4
10.4
9.2
9.8
7.6
2
11.6
9.7
9.7
9.0
11.2
7.9
3
10.6
8.7
9.9
8.9
10.7
9.0
4
9.0
7.2
9.8
8.6
9.6
7.8
5
11.2
10.0
11.1
9.9
10.1
第十三章 协方差分析
协方差分析的意义
➢对试验进行统计控制 ➢对协方差组分进行估计
• 为了提高试验的精确性和准确性,对处理以外的一切条 件都需要采取有效措施严加控制,使它们在各处理间尽 量一致,这叫试验控制。但在有些情况下,即使作出很 大努力也难以使试验控制达到预期目的。
• 统计控制是试验控制的一种辅助手段。经过这种修 正,试验误差将减小,对试验处理效应估计更为准
确。若 y 的变异主要由x的不同造成(处理没有显著
效应),则各修正后的y 间将没有显著差异(但原y
间的差异可能是显著的)。若 y的变异除掉x不同的
影响外, 尚存在不同处理的显著效应,则可期望各
y间 将有显著差异 (但原y间差异可能是不显著的)。 此外,修正后的 y 和原y的大小次序也常不一致。
所以, 处理平均数的回归修正和修正平均数的显著 性检验,能够提高试验的准确性和精确性,从而更 真实地反映试验实际。这种将回归分析与方差分析 结合在一起,对试验数据进行分析的方法,叫做协 方差分析(analysis of covariance)。
(Y Yˆ)修2 正均数间
(Y
修正均数间
Yˆ)组2 内
MS修正均数间 MS组内
F
组内
组1
( X 0,Y 1 )
Y ( X 1,Y 1 )
(X2,Y2 )
(X0,Y2 )
组2
Y2 Y1 Y2 Y1
X1
X0
X2
二、应用条件
1.各组协变量X与因变量Y的关系是线性的, 即各样本回归系数b本身有统计学意义。
其实质是从Y的总离均差平方和 (Y Y)2 中
扣除协变量X对Y的回归平方和 (Y Y)2 ,
对残差平方和
(Y
Y)2
作进一步分解后再进
行方差分析。
Y
Y
(YY)
(Y Yˆ )
(Yˆ Y)
Y
X
残差平方和的分解
(Y Yˆ)总2 (Y Yˆ)修2 正均数间 (Y Yˆ)组2 内
总 修正均数间 组内
12
492.40 118.74
随机区组设计资料方差分析的变异分解
SS总 SS处理 SS区组 SS误差
总 处理 区组 误差
总变异=处理间变异+区组间变异+误差
随机区组设计资料协方差分析的变异 分解与此相同
反应变量Y (增重)均数
处理因素 (饲料)
协变量
区组
(进食量) (大白鼠)
扣除协变量影响: 用线性回归残差平方和表示
• 例13-1 为研究某降血糖药物的有效性及其 合用盐酸二甲双胍片的有效性,选择收治 90名2型糖尿病患者,并采用随机对照试验 ,分为三个治疗组,第一组为该降糖药组 ,第二组为盐酸二甲双胍片组,第三组为 该降糖药+盐酸二甲双胍片组,每组30名患 者,治疗3个月,主要有效性指标为糖化血 红蛋白。测得每个患者入组前(X)和3个 月后(Y)的糖化血红蛋白含量(%), 试分析三种治疗降糖化血红蛋白的效果是 否不同。
(3)组间离均差平方和、积和及自由度
4.计算总的、组内及修正均数的估计误差平方和、 自由度
5.列协方差分析表,查F界值表,P<0.01,拒 绝H0,接受H1,可以认为在扣除初始糖化血红蛋
白因素的影响后,三组患者的总体降糖均数有差 别。
6.计算公共回归系数bc及各组修正均数
bc
组 内l XY 组 内l XX
2.各样本回归系数b间的差别无统计学意义, 即各回归直线平行。
3.各组残差呈正态分布。 4.各协变量均数间的差别不能太大,否则有
的修正均数在回归直线的外推延长线上。
➢要求:在进行协方差分析前,应先进行方 差齐性检验和回归系数的检验。
➢注意问题:如果不满足以上条件,建议进 行变量变换,符合上述条件后,再进行协方 差分析。
Y
* j
Yj
bc ( X
j
X)
7.修正均数间差别进行两两比较 – q 检验
*
*
Y A YB
q
S Y2 X n0
1
(a
组间l XX 1)组内l
XX
SPSS软件计算
1.建立数据文件 2.绘制散点图与建立直线回归方程 3.回归直线平行性假定的检验
初始X与各组无交互作用可认为 各组回归直线平行,即初始X对糖化血 红蛋白的影响在各组间是相同的。 4.修正均数的计算与假设检验
3.结论:
F=2.19<F0.05(2,21)=3.47 P>0.05 按=0.05水准不拒绝H0,还不能认为扣 除进食量因素的影响后,三种饲料对增 加大白鼠体重有差别。
4.计算公共回归系数与修正均数
bC
误 差l XY 误 差l XX
15102.873 36943.246
0.4088*ຫໍສະໝຸດ Y j Y j bC ( X j X )
协方差分析步骤
1.H0:各总体糖化血红蛋白的修正均数相等 H1:各总体糖化血红蛋白的修正均数不全相等 α= 0.05
2.列表并计算初步结果
协方差分析计算表模式
离均差平方和及积和
估计误差
变异来源 ν
F
lXX
lXY
lYY
ν (Y Y )2 MS
总变异
组间变异
相关主题