当前位置:文档之家› 协方差分析理论与案例

协方差分析理论与案例

协方差分析理论与案例假设我们有N 个个体的K 个属性在T 个不同时期的样本观测值,用it y ,it x ,…,N,t=1,…,T,k=1,…,K 表示。

一般假定y 的观测值是某随机实验的结果,该实验结果在属性向量x 和参数向量θ下的条件概率分布为(,)f y x θ。

使用面板数据的最终目标之一就是利用获取的信息对参数θ进行统计推断,譬如常假设假定的y 是关于x 的线性函数的简单模型。

协方差分析检验是识别样本波动源时广泛采用的方法。

方差分析:常指一类特殊的线性假设,这类假设假定随机变量y 的期望值仅与所考察个体所属的类(该类由一个或多个因素决定)有关,但不包括与回归有关的检验。

而协方差分析模型具有混合特征,既像回归模型一样包含真正的外生变量,同时又像通常的方差一样允许每个个体的真实关系依赖个体所属的类。

常用来分析定量因素和定性因素影响的线性模型为:*,1,,,1,,it it itit it y x u i N t T αβ'=++=⋅⋅⋅=⋅⋅⋅ 从两个方面对回归系数估计量进行检验:首先,回归斜率系数的同质性;其次,回归截距系数的同质性。

检验过程主要有三步:(1) 检验各个个体在不同时期的斜率和截距是否都相等;(2) 检验(各个体或各时期的)回归斜率(向量)是否都相等; (3) 检验各回归截距是否都相等。

显然,如果接受完全同同质性假设(1),则检验步骤中止。

但如果拒绝了完全同质性性假设,则(2)将确定回归斜率是否相同。

如果没有拒绝斜率系数的同质性假设,则(3)确定回归截距是否相等。

(1)是从(2)、(3)分离出来的。

基本思想:在作两组或多组均数1y ,2y ,…,k y 的假设检验前,用线性回归分析方法找出协变量X 与各组Y 之间的数量关系,求得在假定X 相等时修定均数1y ',2y ',…,k y '然后用方差分析比较修正均数间的差别,这就是协方差分析的基本思想。

协方差分析的应用条件:⑴要求各组资料都来自正态总体,且各组的方差相等;(t 检验或方差分析的条件)⑵各组的总体回归系数i β相等,且都不等于0(回归方程检验)。

因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用。

⑴各比较组协变量X 与分析指标Y 存在线性关系(按直线回归分析方法进行判断)。

⑵各比较组的总体回归系数i β相等,即各直线平行(绘出回归直线,看是否平行)。

协方差分析适用的资料:完全随机设计、随机区组设计、拉丁方设计、析因设计等资料;协变量X 可以仅有一个,称一元协方差分析;协变量也可以有多个,称多元协方差分析。

协方差计算公式:相关系数:()()x x y y r --=将公式右端的分子分母同除以自由度(n -1),得:()()/(1)x x y y n r ---=其中:2()1x x n --∑是x 的均方MS x ,它是x 的方差2x σ的无偏估计量; 2()1y y n --∑是y 的均方MS y ,它是y 的方差2y σ的无偏估计量;()()1x x y y n ---∑称为x 与y 的平均的离均差的乘积和,简称均积,记为MP xy ,即()()()()=11xy x y xy x x y y n MP n n ---==--∑∑∑∑ 与均积相应的总体参数叫协方差(covariance ),记为COV (x ,y )或xy σ。

统计学证明了,均积MP xy 是总体协方差COV (x ,y )的无偏估计量,即EMP xy = COV (x ,y )。

于是,样本相关系数r 可用均方MS x 、MS y ,均积MP xy 表示为:MP r =相应的总体相关系数ρ可用x 与y 的总体标准差x σ、y σ,总体协方差COV(x ,y )或xy σ表示如下:(,)xyx yx yCOV x y σρσσσσ==均积与均方具有相似的形式,也有相似的性质。

在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。

统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。

这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得相应均积的方法亦称为协方差分析。

1.协方差分析是将线性回归与方差分析相结合的一种分析方法;2.把对反应变量Y 有影响的因素X 看作协变量,建立Y 对X 的线性回归,利用回归关系把X 值;3.化为相等,再进行各组Y 的修正均数间比较。

修正均数是假设各协变量取值固定在其总均数时的反应变量Y 的均数。

其实质是从Y 的总离均差平方和2()Y Y ∑-中,扣除协变量X 对Y 的回归平方和2()Y Y ∧∑-,对离回归平方和2()Y Y ∧∑-作进一步分解后再进行方差分析。

方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量,方差分析数据结构:i ijiju t e Y=++协方差分析将方差分析与回归分析结合了起来,协方差分析数据结构:y ij iju Y =协方差案例:设有k 个处理、n 次重复的双变量试验资料,每处理组内皆有n 对观测值x 、y ,则该资料为具kn 对x 、y 观测值的单向分组资料,其数据一般模式如表10—1所示。

表1的x 和y 变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。

其乘积和的剖分则为:总变异的乘积和T SP 是ij x 与..x 和ij y 与..y 的离均差乘积之和,即:kn y x y x y y x x SP k i nj ij ij k i n j ij ij T ......)..)((1111-=--=∑∑∑∑==== (1) T df =kn -1其中,kn y y kn x x y y x x ki i k i i ....,....,..., (1)1====∑∑== 。

处理间的乘积和t SP 是.i x 与..x 和.i y 与..y 的离均差乘积之和乘以n ,即:∑∑==-=--=ki i i ki i i i i t kn y x y x n y y x x n SP 11....1..)...)(.((10-6)1-=k df t处理内的乘积和e SP 是ij x 与.i x 和ij y 与.i y 的离均差乘积之和,即:∑∑∑∑∑=====-=-=--=ki nj ki t T ki i i nj ij ij i ij i ij e SP SP y x n y x y y x x SP 11111..1.).)(((10-7)e df =k (n -1)以上是各处理重复数n 相等时的计算公式,若各处理重复数n 不相等,分别为n 1、n 2、…、n k ,其和为∑=ki in1,则各项乘积和与自由度的计算公式为:∑∑∑===-=k i n j ki ii i ij ij T iny x y x SP 111..T df =∑=k i i n 1-1 (10-8)∑=-+++=k i ikk k t n y x n y x n y x n y x SP 1222111............. 1-=k df t∑∑===ki n j ij ij e iy x SP 11-⎥⎦⎤⎢⎣⎡+++k k k n y x n y x n y x .........222111=SP T -SP te df =∑=ki i n 1-k =df T -df t (10-9)有了上述SP 和df ,再加上x 和y 的相应SS ,就可进行协方差分析。

【例10.1】为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表10—2,试作分析。

此例,......4321x x x x x +++= =18.25+15.40+15.65+13.85=63.15......4321y y y y y +++==141.80+130.10+144.80+133.80=550.50k =4,n=12,kn =4×12=48(单位:kg )协方差分析的计算步骤如下:(一)求x 变量的各项平方和与自由度 1、总平方和及自由度∑∑=-=-+++=-=75.14815.638325.844815.63)10.1...85.150.1(..2222222)(kn x x SS ijx T )(x T df =kn -1=4×12-1=47 2、处理间平方和与自由度83.04815.63)85.1365.1540.1525.18(121 (122)222212)(=-+++=-=∑=kn x x n SS k i i x t )(x t df =k -1=4-1=33、处理内平方和与自由度)(x e SS =)(x T SS -)(x t SS =1.75-0.83=0.92 )(x e df =)(x T df -)(x t df =47-3=44(二)求y 变量各项平方和与自由度 1、总平方和与自由度∑∑=-=-+++=-=76.96485.55031.6410485.550)00.11...00.1240.12(222222..2)(kn y y SS ijy T )(y T df =kn -1=4×12-1=472、处理间平方和与自由度∑=-+++=-=68.114850.550)80.13380.14480.13080.141(121.1222222..2)(kn y y nSS i y t )(y t df =k -1=4-1=33、处理内平方和与自由度)(y e SS =)(y T SS -)(y t SS =96.76-11.68=85.08 )(y e df =)(y T df -)(y t df =47-3=44(三)求x 和y 两变量的各项离均差乘积和与自由度1、总乘积和与自由度kny x y x SP k i nj ij ij T ....11-=∑∑==25.812450.55015.6350.73212450.55015.6300.1110.1...00.1285.140.1250.1=⨯⨯-=⨯⨯-⨯++⨯+⨯=),(y x T df =kn -1=4×12-1=47 2、处理间乘积和与自由度kny x y x n SP k i i i t ......11-=∑= 12450.55015.63)80.13385.1380.14465.1510.13040.1580.14125.18(121⨯⨯-⨯+⨯+⨯+⨯==1.64),(y x t df =k -1=4-1=33、处理内乘积和与自由度 e SP =T SP -t SP =8.25-1.64=6.61 ),(y x e df =),(y x T df -),(y x t df =47-3=44平方和、乘积和与自由度的计算结果列于表10—3。

相关主题