数理统计14(方差分析)
1 nj
nj
(
i 1
xij )2
C
(8-8)
SSE
k j 1
nj i1
xi2j
k j 1
1 nj (
n j i1
xij )2
SST
SS(A 8-9)
检验统计量
F SSA /(k 1) SSE /(n k)
3、对给定的显著水平 ,查 F 分布表,得临
界值 F (k-1, n-k), 一般取 =0.05。 4、统计判断:若F >F (k-1,n-k), 则 P < , 拒 绝 H0 ,认为因素对试验结果没有显著影响。
F(k-1,n-k)
在进行方差分析时, 还必须注意需满足的 前提条件:
(1)各总体相互独立且服从正态分布; (2)各总体方差相等,即
Xj~N (j , 2 ), j=1, 2, …, k
如果满足这两个条件,方差分析就可取得 精确的结果,否则,只能通过数据变换后 近似地分析。
例8-1 解: (1) 检验 H0 : 1 = 2 = 3 = 4 = 5 H1 : 1 、2 、 3 、 4 、 5 不全等
温度(℃)
60
得率(%) 86
89
91
90
平均(%) 89
65 70 75
80
80 83 76
96
83 90 81
93
88 94 84
95
84 85 82
94
83.75 88 80.75 94.5
应检验 H0 : 1 = 2 = 3 = 4 = 5 H1 : 1 、2 、 3 、 4 、 5 不全相等
如果拒绝 H0 , 就可认为不同水平(不同的温度) 下的得率差异确实有显著性, 即温度对该药的
得率有显著影响;
否则, 则认为不同水平 (不同的温度) 下得率的 差异只是由随机误差造成的。
表8-2 因素水平及观察数据表
水平(组别) A1
A2
…
Ak
总体变量
X1
X2
…
Xk
x11
x12
…
x1k
试验结果
x21
表8-3 单因素方差分析表
方差 来源
离差 平方和
Source SS
组间 (因素)
SSA
组内 (误差)
SSE
总和 (总变差)
SST=SSA + SSE
自由 度
df k-1
n-k
n-1
均方
MS MSA= SSA/k-1 MSE= SSE/n-k
F值
MSA MSE
P值
F >F
则 P<
F<F,
则 P>
临界值 F
单因素方差分析的目的:通过分析各水平 样本效应之间的差异,来检验各水平总体效 应之间的差异,从而确定该因素对试验结果 是否有显著性影响。
例8-1 考察温度对某药得率的影响,选取 5 种 不同的温度,在同一温度下各做了 4 次试验, 结果见表 8-1。试问温度是否对该药的得率有显 著影响?
表8-1 某药在不同温度下的得率
第一节 单因素方差分析
一、方差分析的原理和方法
效应 (effect): 在试验中的试验结果。 因素 (factor): 影响试验结果的条件。 水平 (lever): 因素所处的不同状态或内部分类。 方差分析的目的:是探讨不同因素、不同水平
之间效应的差异,从而考察各因素对试 验结果是否有显著影响。
试验中只有一个因素取不同的水平进行试 验,而其他因素保持不变,这样的试验称为 单因素试验 (one factor trial), 相应的方差分 析就是单因素方差分析。
(xij x )2
j1 i1
组内离差平方和 (sum of square of deviations
within groups) 或误差平方和 (sum of square
error):
组间离差平方和 (sum of square of deviations
between groups) 或因素平方和 (sum of square
factor):
k
SSA n j (x. j x)2
j 1
离差平方和分解公式: SST SSE SSA
总离差 :所有观察效应值之间的差异 组内离差 :随机抽样误差 组间离差 SSA :随机抽样误差和系统性误差 自由度对应分解为: n-1=(n-k)+(k-1)
即 dfT dfE dfA
则 F MSA
MSE
二、方差分析的步骤与实例
1、针对问题,建立原假设与备择假设:
H0 : 1 = 2 = … = k = ; H1 : 1 、2 、…、 k 不全相等
2、分别计算离差平方和及检验统计量 F 值:
C
1 n
(
k j 1
nj i 1
xij )2
2
nx
(8-7)
SSA
k j 1
第八章 方差分析
方差分析 (analysis of variance,
ANOVA, F 检验):多个正态总 体均值比较的一种最基本的统计 分析方法,它是对全部样本观测 值的差异(方差)进行分解,将 某种因素下各组样本观测值之间 可能存在的因素所造成的系统性 误差,与随机抽样所造成的随机 误差加以区分比较,以推断该因 素对试验结果的影响是否显著。
i 1
即有 n1 =n2 =n3 =n4 =n5 =4, n=20, k=5
C
1( n
k j 1
nj i1
xij )2
17442
20
152076.8
k nj
SST
xi2j C
j1 i1
152680 152076.8 603.2
(2)结果汇总表8-4
温度(℃) 60 65 70 75 80 合计 86 80 83 76 96
xi j
89 83 90 81 93
91 88 94 84 95
90 84 85 82 94
nj
4
4
44
4
20
356 335 352 323 378 1744
nj
xi2j 31698 28089 31050 26117 35726 152680
组间变异 组内变异
总变异
统计量
其中
称为组间均方 (mean square between groups) 或因素均方 (mean square factor),
MSE
SSE nk
称为组内均方 (mean square within groups)
或误差均方 (mean square error),
x22
…
x2k
xij
…
…
…
…
xn11
xn22
…
xnkk
平均值 x.j x. 1
x. 2
…
x. k
其中
样本总均值为
x1 n
k nj
xij
j1 i1
总离差平方和 (sum of square of total deviations)
或总变差 (total deviations):
k nj
SST