当前位置:文档之家› 方差分析公式

方差分析公式

方差分析公式
(20PP-06-2611:03:09)
转载▼
标签:
分类:统计方法
杂谈
方差分析
方差分析(analPsisofvarianee ,简写为ANOV或ANOV A可用于两个或两个以
上样本均数的比较。

应用时要求各样本是相互独立的随机样本;各样本来自正态
分布总体且各总体方差相等。

方差分析的基本思想是按实验设计和分析目的把全部观察值之间的总变异分为两部分或更多部分,然后再作分析。

常用的设计有完
全随机设计和随机区组设计的多个样本均数的比较。

一、完全随机设计的多个样本均数的比较
又称单因素方差分析。

把总变异分解为组间(处理间)变异和组内变异(误差)两部分。

目的是推断k个样本所分别代表的卩1,卩2,……卩k是否相等,以便比较多个处理的差别有无统计学意义。

其计算公式见表19-6.
表19-6完全随机设计的多个样本均数比较的方差分析公式
GC=(艺G) 2/N=艺ni , k为处理组数
方差分析计算的统计量为F,按表19-7所示关系作判断。

例19.9某湖水不同季节氯化物含量测量值如表19-8,问不同季节氯化物含量有
无差别?
表19-8某湖水不同季节氯化物含量(mg/L)
SS 加刖=丄 和
' 10619.265^
170
HO:湖水四个季节氯化物含量的总体均数相等,即 卩仁卩2=卩3=卩4
H1:四个总体均数不等或不全相等
a =0.05
先作表19-8下半部分的基础计算。

C=(艺 G ) 2/N= (588.4) 2/32=10819.205 SS 总=艺 G2-C=11100.84-10819.205=281.635 V 总=N-仁31
(工吋
“ 1
广_ (】6二口尸斗/」期.匸尸千
K
.IT N
"一 -
• r . —I b
K V 组间=k-1=4-1=3
SS 组内=SS 总-SS 组间=281.635-141.107=140.465 V 组内=N-k=32-4=28
MS 组间二SS 组间 /v 组间=141.107/3=47.057
MS组内=SS组内 /v 组内=140.465/28=5.017
F=MS组间 /MS 组内=47.057/5.017=9.380
以v1 (即组间自由度)=3, v2 (即组内自由度)=28查附表19-2 , F界值表,得F0.05(3,28)=2.95,F0.01(3,28)=4.57.本例算得的 F=9.380>F0.01 (3,
28), P v0.01,按a =0.05检验水准拒绝H0,接受H1,可认为湖水不同季节的氯化物含量不等或不全相等。

必要时可进一步和两两比较的q检验,以确定是否任两总体均数间不等。

资料分析时,常把上述计算结果列入方差分析表内,如表19-9.
表19-9例19.9资料的方差分析表
二、随机区组(配伍组)设计的多个样本均数比较
又称两因素方差分析。

把总变异分解为处理间变异、区组间变异及误差三部分。

除推断k个样本所代表的总体均数,卩1,卩2,……卩k是否相等外,还要推断b个区组所代表的总体均数是否相等。

也就是说,除比较多个处理的差别有无统计学意义外,还要比较区组间的差别有无统计学意义。

该设计考虑了个体变异对处理的影响,故可提高检验效率。

表19-10随机区组设计的多个样本均数比较的方差分析公式
C、k、N的意义同表19-6 , b为区组数
例19.10为研究酵解作用对血糖浓度的影响,从8名健康人中抽血并制成血滤液。

每个受试者的血滤液被分成4份,再随机地把4份血滤液分别放置0,45,90, 135分钟,测定其血溏浓度(表19-11),试问放置不同时间的血糖浓度有无差别?处理间:
H0:四个不同时间血糖浓度的总体均数相等,即卩仁卩2=卩3=卩4
表19-11血滤放置不同时间的血糖浓度(mmol/L)
H1:四个总体均数不等或不全相等
a =0.05
区组间:
H0:八个区组的总体均数相等,即卩仁卩2=……卩8
H1:八个区组的总体均数不等或不全相等
a =0.05
先作表19-11下半部分和右侧一栏的基本计算。

C=(艺 G) 2/N= (169.56) 2/32=898.45605
SS总=艺 G2-C=904.1214-898.45605=5.66535
V 总=N-1=32-1=31
V 处理=k-1=4-1=3
一曲=2 •熹)缶
V区组=b-1=8-仁7
SS误差=SS总-SS 处理-SS 区组=5.66535-2.90438-2.49800=0.26297
V误差=(k-1 )( b-1 ) =3X 7=21
MS处理=SS处理 /v 处理=2.90438/3=0.9681
MS区组=SS区组/v 区组=2.49800/7=0.3569
MS误差=SS误差 /v 误差=0.26297/21=0.0125
F 处理=MS处理 /MS 误差=0.9681/0.0125=77.448
F 区组=MS区组/MS误差=0.3569/0.0125=28.552
推断处理间的差别,按v仁3, v2=21查F界值表,得F0.005 (3, 21) =3.07 , F0.01( 3,21)=4.87,P v 0.01 ;推断区组间的差别,按v仁7, v2=21查F界值表,得F0.05 (7, 21) =2.49,F0.01 ( 7, 21) =3.64,P v 0.01.按a =0.05 检验水准皆拒绝H0,接受H1,可认为放置时间长短会影响血糖浓度且不同受试者的血糖浓度亦有差别。

但尚不能认为任两个不同放置时间的血糖浓度总体均数皆有差别,必要时可进一步作两两比较的q检验。

表19-12例19.10资料的方差分析表
(各组ni 相等)公式(19.14)
总 5.66538 31
三、多个样本均数间的两两比较的 q 检验
经方差分析后,若按a =0.05检验水准不拒绝H0,通常就不再作进一步分析;若 按a =0.05甚至a =0.01检验水准拒绝H0,且需了解任两个总体均数间是否都存 在差别,可进一步作多个样本均数间的两两比较。

两两比较的方法较多,在此仅
介绍较常用的q 检验(Newman-Keuls 法)
t
/ ” 严(1 彳 _L_
(各组ni 不等)公式(19.15)
式中,GA-GB 为两两对比中,任两个对比组 A 、B 的样本均数之差;sGA-GB 为两 样本均数差的标准误;ni 为各处理组的样本含量;nA, nB 分别为A B 两对比组 的样本含量;MS 误差为单因素方差分析中的组内均方(MS 组内)或两因素方差 分析中的误差均方(MS 误差)。

计算的统计量为q,按表19-13所示关系作判断。

例19.11对例19.9资料作两两比较
H0:任两个季节的湖水氯化物含量的总体均数相等,即 卩A=y B
H1:任两总体均数不等,即 卩Ap B
表19-13|q|值、P 值与统计结论
a
|q| P 值 统计结论
0.05 V q °.05 ( v.a )
>0.05 不拒绝H,差别无统计学意义 0.05
A q °.05 ( v.a )
<0.05 拒绝H0。

接受H,差别有统计学意义 0.01
A q
°.01 ( v.a )
<0.01
拒绝H ,接受H ,差别有高度统计学意义
a =0.05
1.将四个样本的均数由大到小排列编秩,注明处理组
G 167.9 159.3 131.9 129.3 处理组 春 夏 秋 冬 秩次
1
2
3
4
2.计算sGA-GB 本例各处理组的样本含量n1相等,按式(19, 14)计算两均数差 的标
准误。

已知 MS组内=5.017, n=8
表19-14两两比较的q检验计算表
表中第(1)栏为各对比组,如第一行1与4,指A为第1组,B为第4组。

第(2)栏为两对比组均数之差,如第一行为 G1与G4之差,余类推。

第(3)栏为四个样本均数按大小排列时,A B两对比组范围内所包含的组数 a,如第一“1与4” 范围内包含4个组,故a=4.第(4)栏是按式(19.13 )计算的统计量q值,式| 中的分母0.7919是按式(19.14 )计算出来的SGA-GB第( 5)、( 6)栏是根据误差自由度v与组数a查附表19-3q界值表所得的q界值,本例v误差=28,因q界值表中自由度一栏无28,可用近似值30或用内插法得出q界值,本例用近似值 30 查表,当 a=4 时,q0.05( 30, 4) =3.85 , q0.01 ( 30, 4) =4.80,余类推。

第(7)栏是按表19-13判定的。

4.结论由表19-14可见,除秋季与冬季为P V0.05夕卜,其它任两对比组皆为 P V 0.01,按a =0.05检验水准均拒绝H0,接受H1,可认为不同季节的湖水氯化物含量皆不同,春季氯化物含量最高,冬季含量最低。

PS:进行方差分析前必须要做方差齐性检验和正态分布检验,至于如何做,方法很多了,常见的正态性检验有Kolmogorov-Smirnov 检验和Shapiro-Wilk 检验。

方差齐性常采用Bartlett检验。

相同的数据,不同的软件,采用相同的方法给出的p值应该是一
样的。

相关主题