第七章 方差分析
第七章 方差分析
主要内容: 方差分析的概念; 单因素方差分析; 无交互作用的双因素方差分析。
1
第一节 方差分析引论
一、问题的提出
例1、某饮料在五家超市的销售情况。(6) (9)
超市 1 2 3 4 5
均值
某饮料在五家超市的销售情况表
无色 26.5 28.7 25.1 29.1 27.2 27.32
为r 1,MSE 的自由度为k 1r 1 。
36
(三)分析步骤 1、提出假设设:
H10:1 2 i k H11:( i i 1,2, , k)不完全相等 H 20:1 2 j r H 21: j ( j 1,2, , r)不完全相等 其中:i为因素A的第i个水平(总体)的均值, j为因素B的第j个水平(总体)的均值。
3495.37
绿色
30.8 29.6 32.4 31.7 32.8 157.3 4955.29 31.46
4948.66
合计
573.9 16583.99 16544.91
28.70
22
某饮料的方差分析表
误差来源 误差平方和 自由度 均方 F值
组间误差 71.11 组内误差 44.82
3 23.7 8.46 16 2.8
若F
F,则拒绝原假设
H
;
0
若F
F,则不能拒绝原假设
H
。
0
18
(四)方差分析表 前述(二)之1的计算,一般在方差分 析计算表中进行,(二)之2、3在方差分 析表中进行。方差分析计算表与方差分析 表的一般形式分别如后一页:
19
方差分析计算表
观
察
因 值
素水
平
A1
A2
L
试验批号
1
x11
x21
L
2
总误差 115.93 19
临界值
3.24
由于F F,所以拒绝原假设,接 受备择假设, 既饮料包装的颜色对销 售量有显著影响。
23
例2、某课程结束后,学生对该授课教师的教学质量 进行评估,评估结果分为优、良、中、差四等。教 师对学生考试成绩的评判和学生对教师的评估是分 开进行的,他们互相都不知道对方给自己的打分。 有一种说法,认为给教师评为优秀的这组学生的考 试分数,可能会显著地高于那些认为教师工作仅是 良、中或差的学生的分数。同时认为,对教师工作 评差的学生,其考试的平均分数可能最低。为对这 种说法进行检验,从对评估的每一个级组中,随机 抽取出共26名学生。试以0.05的显著水平检验各组 学生的分数是否有显著差别。26名学生的考试成绩 如下表。
10
第二节 单因素方差分析
一、样本数据结构(28)
单因素方差分析的样本数据结构
观
察
因 值
素水
平
A1
A2
L
Ak
试验批号
1
x11
x21
L
xk1
2
x12
x22
L
xk 2
M
M
M
M
M
ni
x1n1
x2n2
L
x k nk
11
二、单因素方差分析的步骤
(一)提出假设
H0:1 2 i k H1:(i i 1,2, ,k)不完全相等
37
2、在方差分析表中计算相应的统计量
无交互作用的双因素方差分析表
误差来源
误差平方和
自由度 均方 F值
因素A的组间误差
SS A
k 1
MSA FA
因素B的组间误差
SSB
r 1
MS B
FB
随机误差
SSE
k 1r 1 MSE
总误差
SST
n 1
38
3、统计检验
在给定的显著水平下,查F分布表得到临界值:
ni xi2j nx 2
i1 j1
i1 j1
k
ni (xij xi )2 k
ni (xi x)2
i1 j1
i1 j1
SSE SSA
15
其中: (1)组间误差,其自由度为k-1:
k ni
k
SSA
(xi x)2 ni (xi x)2
x j x 2
i1 j 1
i1 j 1
SST SSA SSB SSE
34
其中:
k r
SSE
xij xi x j x 2
i1 j1
kr
SSA
xi x 2
i1 j1
k r
SSB
x j x 2
x1 x2
A … …… … …
…
Ak
xk1 xk2 … xkr
Tk·
…
xk
列列均和值T.xj j Tx·11 Tx·22
… …
Tx·kr
总和 T
总均x 值
32
其中:
xi
1 r
r
xij
j 1
x j
1 k
k i 1
xij
x
1 kr
k i 1
r
xij
j 1
0;反之,则接受H
。
0
对于例1,在显著水平 0.05下,哪两种包装
颜色的饮料的销量有显 著差别?
x1 x2 27.32 29.26 2.24
LSD t0.025 (16)
2.8 (1 1) 2.24 55
由于x1 x2 LSD 1与2没有显著差异。
(i 1,2, k )
( j 1,2, r)
33
(二)误差平方和的分解(32)
k r
SST
xij x 2
i1 j 1
k r
xij xi x j x 2
i1 j 1
k r
kr
xi x 2
k
xij
ni xi
x i1 j1 n
i1 n
,(n n1 n2 nk)
14
2、在方差分析中,需要计算三个误差平方
和,即总误差平方和( SST )、组间误差平方
和( SS A )及组内误差平方和( SSE ) 。
k
SST
ni (xij x)2 k
10 14
20 18
12 18
6 10
区
B4 16 4
8
6 18
B5 26 22 16 20 10
31
(一)样本数据结构
无交互作用的双因素方差分析的样本结构表(34)
B水平
因素B
行和 行均值
A水平
B1 B2 … Br
Ti.
xi
因 素
A1
x11 x12 … x1r
A2
x21 x22 … x2r
T1· T2·
ni xi2
总均值
无色
26.5 28.7 25.1 29.1 27.2 136.6 3742.6 27.32
3731.91
粉色
31.2 28.3 30.8 27.9 29.6 147.8 4377.54 29.56
4368.97
橘黄色
27.9 25.1 28.5 24.2 26.5 132.2 3508.56 26.44
i1 j1
MS A
SSA ,MS k 1
B
SSB ,MS r 1
E
k
SSE
1r
1
35
构造统计量:
FA
MS A MS E
~
Fk
1,k
1r
1
FB
MS B MS E
~ Fr 1,k 1r 1
其中 MSA 的自由度为k 1,MSB 的自由度
24
观测值
i
1 2 3 4 5 6 7 8 9 10
26名学生考试成绩
学生对教师评估等级
优
良
中
差
85
80
73
76
77
78
80
72
79
94
92
70
84
73
76
85
92
79
6
90
86
73
91
75Leabharlann 816425
解:若各组学生的平均成绩之间没有显著差异, 则表明学生对教师的评估结果与他们的成绩之间 没有必然的联系。
售(因素B),现从每个地区随机抽取一个规模相同的超级市场,
得到该商品不同包装的销售资料如下表。现欲检验包装方式和
销售地区对该商品销售是否显著影响(
0.)05?
某种商品不同地区不同包装的销售资料
包装方式(A)
A1
A2
A3
A4
A5
B1 20 12 20 10 14
销 售地(B)
B2 B3
22 24
x12
x22
M
M
M
M
ni
列和
x1n1
x2n2
L
n1
n2
x1 j
x2 j
j 1
j 1
列平方和
x n1 2 1j
n2
x22j
j 1
j 1
x x 列均值
1
2
Ak
xk1
xk 2
M
x k nk
nk
xkj