第八章-方差分析
表1 对照组及各实验组家兔血清ACE浓度(u/ml)
实
对照组 61.24 58.65 A降脂药 82.35 56.47
验
B降脂药
组
C降脂药 25.46 38.79
26.23 46.87
46.79
37.43 66.54
61.57
48.79 62.54
24.36
38.54 42.16
13.55
19.45 34.56
SS 及其自由度 df 分别分解成处理间、区组间和误差3部分,然
后分别求得以上各部分的变异(MS处理、MS区组和MS误差),进 而得出统计量F值(MS处理/MS误差、MS区组/MS误差)。
2、意义:用方差分析比较多个样本均数,可有效地控制第一
类错误。
t 检验和 u 检验适用于两个样本均数的比较,对于 k 个
SS A ni ( xi x )
2
k
k
( xij ) 2
j 1
ni
i
i 1
i 1
ni
( x) 2 N
(8-3)
(8-4)
df A k 1
SS A MS A df A
(8-5)
3)组内离均差平方和(sum of square of deviations within groups
用途: ① 两个或多个总体均数间的比较;
② 回归方程的线性假设检验;
③ 多元线性回归分析中偏回归系数的假设检验; ④ 分析两个或多个因素间的交互作用; ⑤ 两样本的方差齐性检验等。
第一节
单因素方差分析
(one-way ANOVA)
一、方差分析的原理和方法
1、试验研究的三要素:
处理因素(factor):是指研究者根据研究目的而施加给实验
方差分析:对不同处理因素或同一处理因素的 不同水平的实验效应有无差异的分析。
2、方差分析的分类: 根据处理因素的个数分为:
单因素(one-way ANOVA) 双因素(two-way ANOVA)
多因素方差分析(multi-way ANOVA)
根据处理因素的水平分为:
固定效应模型(fixed-effects model) 随机效应模型(random-effects model)
例8-2
方差分析的检验步骤为:
1)建立检验假设,确定检验水准 H0:四组家兔的血清ACE浓度总体均数相等, μ1=μ2=μ3=μ4 H1:四组家兔的血清ACE浓度总体均数不等或不全相等, 各μi不等或不全相等
总变异
组间变异 组内变异
个体变异 随机测量变异 可能的处理 因素的变异
个体变异
系统性误差
随机误差
随机测量变异
方差分析是将总变异中的离均差平方和(sum of squares,
SS)及其自由度(freedom,df)分别分解成相应的若干部
分,然后求各相应部分的变异;再用各部分的变异与组内
(或误差)变异进行比较,得出统计量 F 值;最后根据 F 值
59.27
60.87
372.59 6
62.10
30.33
20.68 229.17 7
32.74
10.96
48.23 191.00 7
27.29
x
j 1
ni
ij
329.92 6
54.99
1122.68 26
43.18
x
(N )
(x)
ni
i
x
j 1
xi n
2 ij
18720.97
23758.12
的大小确定 P 值,作出统计推断。
eg1: 完全随机设计的方差分析,是将总变异中的离均差平方和 SS
及其自由度 df 分别分解成组间和组内两部分,SS组间 / df组间和SS组内
/df组内分别为组间变异(MS组间)和组内变异(MS组内),两者之比 即为统计量F(MS组间/MS组内)。
eg2: 随机区组设计的方差分析,是将总变异中的离均差平方和
混合效应模型(mixed-effects model)
3、单因素试验(one factor trial):试验中仅有一个处理因
素,但取不同水平,而其它因素保持不变。又称完全随 机设计(completely random design),即将观察对象随 机地分为若干组,每组给予同一处理因素的不同水平, 以观察处理因素的不同水平间有无差异。
5)方差分析的统计量:
F MSA / MSE
(8-10)
总结计算公式:
完全随机设计的单因素方差分析是把总变异的离均
差平方和SS及自由度分别分解为组间和组内两部分,其 计算公式如表3。
表3 单因素方差分析表(analysis of variance table)
变异来源 离均差平方和(SS) 自由度( df ) 均方( MS ) F
学时分配:3学时(理论)
单因素方差分析 多重比较(自学) 两因素方差分析(自学) 交叉设计的方差分析(自学)
学习目的和要求
掌握方差分析的基本思想和要求、熟练运用方差分析
步骤和方差分析表进行单因素方差分析 ;
熟悉两两间多重比较的方法;
了解运用方差分析表进行两因素方差分析的方法、用
Excel 进行方差分析的运算。
SSE SST SSA
dfE N k
(8-7)
(8-8)
SSE MSE dfE
(8-9)
4)三种变异的关系:
SST ( xij x ) 2 [( xij x i ) ( x i x)]2
i 1 j 1 i 1 j 1
k
ni
k
ni
ni ( x i x) 2 ( xij x i ) 2
4! 6 次。假设每次比较所 2!(4 2)!
率为1-0.05=0.95;那么6次检验都不犯第一类错误的概率为(1-0.05)6 =0.7351,而犯第一类错误的概率为0.2649。
(二)方差分析的具体步骤
1.公式: 将 N 个受试对象随机分为 k 组,分别接受不同的 处理水平。归纳整理数据的格式、符号见表2。
8088.59
6355.43
56923.11 ( x 2)
由表1可见,26只家兔的血清ACE浓度各不相同,称为总
变异;四组家兔的血清ACE浓度均数也各不相同,称为组间
变异;即使同一组内部的家兔血清ACE浓度相互间也不相同, 称为组内变异。 该例的总变异包括组间变异和组内变异两部分,或者说可 把总变异分解为组间变异和组内变异。组内变异是由于家兔间 的个体差异所致。组间变异可能由两种原因所致,一是抽样误 差;二是由于各组家兔所接受的处理水平不同。
8088.59
6355.43
56923.11 ( x 2)
1)总离均差平方和(sum of square of total deviations,总变差)
及自由度
总变异的离均差平方和为各变量值与总均数( x )差值 的平方,离均差平方和和自由度分别为:
2 ( x ) SST ( xij x ) 2 x 2 N i 1 j 1 k ni
单因素方差分析
本质:不考虑个体差异的影响,仅涉及一个处理因素,
但处理因素可以有两个或多个水平。
在实验研究中按随机化原则将受试对象随机分配到一个 处理因素的多个水平中去,然后观察各组的试验效应; 在观察研究(调查)中按某个研究因素的不同水平分组,
比较该因素的效应。
要求:样本含量尽可能相等或相差不大。
i 1 i 1 j 1
k
k
ni
SS A SSE
dfT n 1 (k 1) ( N k ) df A dfE
可见,完全随机设计的单因素方差分析时,总的离均差
平方和(SST)可分解为组间离均差平方和(SSE)与组内离均 差平方和(SSA)两部分;相应的总自由度( dfT )也分解为组 间自由度( df A)和组内自由度( df E )两部分。
误差平方和)、自由度和均方(mean square within groups, 误差均方)
组内离均差平方和为各处理组内部观察值与其均数( x i)差 值的平方和之和:
SSE ( xij xi ) 2
i 1 j 1
k
ni
(8-6)
数理统计证明,总离均差平方和等于各部分离均差平 方和之和,因此,
方差分析(Analysis of variance,ANOVA):1923年
由英国统计学家 R. A. Fisher 首先提出,以F 命名其统计
量,故方差分析又称F 检验。
应用条件: ① 各样本必须是相互独立的随机样本——独立性; ② 各样本来自正态分布总体——正态性; ③ 各样本总体方差相等——方差齐性。
用途:用于单因素试验设计的处理因素的多个水平的样 本效应(均数)间比较,其统计推断是推断各样本所代表 的各总体效应(均数)是否相等。
eg: P188 例8-1
(一)方差分析的基本思想 1、基本思想:
eg: 有4组进食高脂饮食的家兔,接受不同药物处理后,测 定其血清肾素血管紧张素转化酶(ACE)浓度(表1),试 比较四组家兔的血清ACE浓度。
方差分析的基本思想:
根据研究目的和试验设计类型,将所有观察单位的总变
异按设计或需要分为两个部分,一部分为组内变异(抽样误
差——个体变异或随机测量变异,即随机因素引起的随机误差),另
一部分为组间变异(包括组内变异和可能存在的处理因素引起的变
异),然后由组间变异除以组内变异,若远远大于1,则处理
因素可能有影响,即各组之间有差异。
…
nk
表1 对照组及各实验组家兔血清ACE浓度(u/ml)