当前位置:文档之家› 第七章 协方差分析

第七章 协方差分析

r
( x x )( y y ) 2 2 ( x x ) ( y y )
若将公式右端的分子分母同除以自由度(n1),得
r
( x x )( y y ) /( n 1) ( x x ) ( y y )
2
2

(n 1)

若 y 的变异主要由x的不同造成(处理没有显 著效应),则各矫正后的 y 间将没有显著差异(但 原y间的差异可能是显著的)。 若 y的变异除掉x不同的影响外, 尚存在不 同处理的显著效应,则可期望各y 间将有显著差 异 (但原y间差异可能是不显著的)。此外,矫正 后的 y 和原y的大小次序也常不一致。
k n k n
(10-7)
df e=k(n-1)
以上是各处理重复数n相等时的计算公式, 若各处理重复数n不相等,分别为n1、n2、…、 k nk,其和为 ni ,则各项乘积和与自由度的计 i 1 算公式为:
SPT xij y ij
i 1 j 1 k ni
xi . y i .
于是,样本相关系数r可用均方MSx、MSy,
均积MPxy表示为:
r MPxy MS x MS y
上一张 下一张 主 页 退 出
(10-3)
相应的总体相关系数ρ 可用x与y的总体标 准差 x 、 y ,总体协方差COV(x,y)或 xy 表 示如下:

COV ( x, y)
x y

在分析阶段控制混杂因素的方法:
1、采用分层分析:如把年龄分组,再比较 同一年龄组的正常体重与超重组有无差别。 (适用:计量、计数资料)
2、协方差分析(适用:计量资料) 3、多因素分析(适用:计量、计数资料)
协方差分析(analysis of covariance,ANCOVA)
将线性回归与方差分析结合起来,检 验两组或多组修正均数间有无差异的一种 统计方法,用于消除混杂因素对分析指标 的影响。 协变量:在进行协方差分析时,混杂因素 统称为协变量。
协方差分析适用的资料 协方差分析可用于: 完全随机设计、随机区组设计、拉丁方设计、 析因设计等资料; 协变量X可以仅有一个,称一元协方差分析; 协变量也可以有多个,称多元协方差分析。
协方差分析有二个意义 , 一是对试验进行 统计控制,二是对协方差组分进行估计,现分 述如下。 一、对试验进行统计控制 为了提高试验的精确性和准确性 ,对处理 以外的一切条件都需要采取有效措施严加控制, 使它们在各处理间尽量一致,这叫试验控制。
u y ti e( X ij ux) ij Y ij
回归 系数
方差分析 回归分析
Y
ij
ij
u ti eij
协变量效 应
Y
uy ( X ij ux) ij
可见,协方差分析将方差分析与回归分析结合了起来.
第二节 单因素试验资料的协方差分析
设有k个处理、n次重复的双变量试验资料,
协方差分析的基本思想: y k 的假 在作两组或多组均数 y1 ,y 2 „, 设检验前,用线性回归分析方法找出协变 量X与各组Y之间的数量关系,求得在假定X 相等时修定均数 , 'k ,然后用方差 y '1 , y '2 y 分析比较修正均数间的差别,这就是协方 差分析的基本思想。
协方差分析的应用条件
k
x1 . y1 . x2 . y 2 . xk . y k . x ij y ij ... n n n 2 k 1 j 1
ni
=SPT-SPt =dfT-dft df e = n-k i
i 1 k
(10-9)
有了上述SP和df,再加上x和y的相应SS, 就可进行协方差分析。 【例10.1】 为了寻找一种较好的哺乳仔猪 食欲增进剂,以增进食欲,提高断奶重,对哺 乳仔猪做了以下试验: 试验设对照、配方1、 配方2、配方3共四个处理,重复12 次,选择
上一张 下一张 主 页
退 出

这时可利用仔猪的初始重(记为x)与其增重 (记为y)的回归关系, 将仔猪增重都矫正 为初始重相同时的增重,于是初始重不同 对仔猪增重的影响就消除了。由于矫正后 的增重是应用统计方法将初始重控制一致 而得到的,故叫统计控制。统计控制是试 验控制的一种辅助手段。经过这种矫正, 试验误差将减小,对试验处理效应估计更 为准确。
n
i 1
k
i
df T ni 1
i 1
k
(10-8)
上一张 下一张 主 页
退 出
xk . y k . x.. y.. x1 . y1 . x 2 . y 2 . SPt ... k n1 n2 nk ni
df t k 1
SPe
i 1

i 1
⑴要求各组资料都来自正态总体,且各组的方 差相等;(t检验或方差分析的条件) ⑵各组的总体回归系数β i相等,且都不等于0 (回归方程检验)。 因此,应用协方差分析前,要对资料进行 方差齐性检验和回归系数的假设检验(斜率同 质性检验),只有满足上述两个条件之后才能 应用,否则不宜使用。
协方差分析的应用条件
可以控制的混杂因素:最好在设计阶段(也可 在分析阶段)进行控制。 难以控制的混杂因素:在分析阶段进行控制。
常见的实例
(1)比较不同施肥量对果树单株产量的影 响,果树起始干周是混杂因素。 (2)比较两种药物治疗高血压的疗效,年 龄是一个混杂因素。 (3)研究不同饲料对动物增加体重的作用 时,动物的初始体重、进食量等因素。 (4)… …
混杂因 素
ቤተ መጻሕፍቲ ባይዱ
药物
疗效
病情
举 例
心 理 因 素 其他因 素
各组间的效应进行比较,必须保持组间的 影响因素(混杂因素的比例)相同,组间 才具有可比性。
处理因素
T + S1
混杂因素
e + s1
(实验组)

T
S2
e
s2
(对照组)
(在设计阶段控制混杂因素的方法)
在混杂因素中,有些是难以完全控制的, 如,天气变化,饲料的进食量;有些是可以控 制的,如年龄,动物的初始体重。
总变异的乘积和SPT是xji与 x ..和yji与 y.. 的离均 差乘积之和,即:
SPT ( xij x..)( y ij y..)
i 1 j 1 k n
k
n
x.. y.. xij y ij kn i 1 j 1
df T =kn-1
(10-5)
上一张 下一张 主 页
xy x y
(10-4)
均积与均方具有相似的形式 , 也有相似的 性质。在方差分析中,一个变量的总平方和与
自由度可按变异来源进行剖分,从而求得相应
的均方。统计学已证明:两个变量的总乘积和
与自由度也可按变异来源进行剖分而获得相应
的均积。这种把两个变量的总乘积和与自由度 按变异来源进行剖分并获得获得相应均积的方 法亦称为协方差分析。
的乘积和,简称均积,记为MPxy,即
MPxy ( x x )( y y ) n 1
n 1

xy
( x)( y ) n 1 n
(10-2)
与 均 积 相 应 的 总 体参 数 叫 协 方 差
(covariance),记为COV(x,y)或 xy 。统 计学证明了,均积MPxy是总体协方差COV(x,y) 的无偏估计量,即 EMPxy= COV(x,y)。
每处理组内皆有n对观测值x、y,则该资料为 具kn对x、y观测值的单向分组资料,其数据 一般模式如表10—1所示。
上一张 下一张 主 页
退 出
表10—1 kn对观测值x、y的单向分组资料的 一般形式
表10—1的x和y变量的自由度和平方和的剖分参 见单因素试验资料的方差分析方法一节。其乘积和的 剖分则为:
退 出
其中,
x.. xi ., y.. y i .,
i 1 i 1
k
k
x.. x..
kn y.. y.. kn
,
处理间的乘积和SPt是 x i . 与x .. 和 y i . 与y.. 的 离均差乘积之和乘以n,即:
1 k x.. y.. SPt n ( xi . x..)( y i . y..) xi . yi . n i 1 kn i 1 (10-6) df k 1

首先,我们看看方差分析数据结构:
u t e i ij Y ij
第i组第j个观 测值 一般均值
第i组的组效 应
随机误差
方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量

下面我们再看协方差分析数据结构(单因 素完全随机设计试验资料的协方差分析):
观测值=一般均值+水平影响+协变量影响+随机误差
第七章 协方差分析
第一节 协方差分析的意义
上一张 下一张 主 页
退 出
在科研中,实验效应除了受到处理因 素的作用外,尚受到许多非处理因素的影 响。如在研究临床疗效时,疗效的好坏不 仅与治疗措施有关,还受病人的年龄、性 别、病情、心理、环境、社会等因素的影 响。
药物临床疗效研究
患者的状况(性别、年龄
⑴各比较组协变量X与分析指标Y存在线性 关系(按直线回归分析方法进行判断)。 ⑵各比较组的总体回归系数βi相等,即各直 线平行(绘出回归直线,看是否平行)。
两条回归直线不平行
结论: 本资 料不 宜做 协方 差分 析
三条回归直线基本平行
各回归系数不 为零
结论: 本资 料可 以做 协方 差分 析
不满足条件时的处理方法 X与Y不满足线性关系时,通常情况下是 对X或Y或两者作适当的变量变换,使之符 合线性关系。
相关主题