当前位置:文档之家› 方差分析讲义教材

方差分析讲义教材

▪ 所要检验的对象称为因子 ▪ 要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或
因子
2. 水平
▪ 因素的具体表现称为水平 ▪ A1、A2、A3、 A4四种颜色就是因素的水平
3. 观察值
▪ 在每个因素水平下得到的样本值 ▪ 每种颜色饮料的销售量就是观察值
2020/10/17
一、方差分析的内容
④计算公式为
k ni
2k
2
SSA xix ni xix
i1j1
i1
▪ 前例的计算结果:SSA = 76.8455
2020/10/17
二、单因素方差分析的步骤
三个平方和的关系
总离差平方和(SST)、误差项离差平方和(SSE)、 水平项离差平方和 (SSA) 之间的关系
k n i
2 k n i
2k
2
xijx xijxi n ixix
i 1j 1
i 1j 1
i 1
2020/10/17
SST = SSE + SSA
离差平方和的分解与显著检验
记:
1 ni
Xi n j1 Xij
将Q进行分解:
1 k ni
X n i1
Xij
j1
k ni
SST(Xij X)2 i1 j1
k n i
其计算公式为
k ni
2
SST
xij x
i1 j1
▪ 前例的计算结果:
SST = (26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2
=115.9295
2020/10/17
二、单因素方差分析的步骤
计算SSE
①每个水平或组的各样本数据与其组平均值的离差平方和 ②反映每个样本各观察值的离散状况,又称组内离差平方和 ③该平方和反映的是随机误差的大小 ④计算公式为
超市
1 2 3 4 5
2020/10/17
该饮料在五家超市的销售情况
无色
粉色 橘黄色
绿色
26.5
31.2
27.9
30.8
28.7
28.3
25.1
29.6
25.1
30.8
28.5
32.4
29.1
27.9
24.2
31.7
27.2
29.6
26.5
32.8
一、方差分析的内容
(二)几个基本概念 1. 因素或因子
方差分析就是把总的 试验数据的波动分成
2020/10/17
1、反映因素水平改变引起的波动。 然后加以比较进行统
2、反映随机因素所引起的波动。
计判断,得出结论。
第一节 方差分析的基本问题
一、方差分析的内容 二、方差分析的基本思想 三、方差分析的原理
2020/10/17
一、方差分析的内容
(一)例题
某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄 色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可 能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级 市场上收集了前一时期该饮料的销售情况,见表。试分析饮料的颜色是否对销 售量产生影响。
5
27.2
29.6
26.5
32.8
合计
136.6
147.8
132.2
157.3
水平均值
x1 =27.32
x2=29.
56
x3=26.
44
x4=31.
46
观察值个数 n1=5
n2=5
n3=5
n4=5
2020/10/17
573.9
总均值
x =28.695
二、单因素方差分析的步骤
全部观察值 x ij 与总平均值 x 的离差平方和 反映全部观察值的离散状况
i 1j 1
i 1
在假设H0成立的条件下,可以证明:
SS2 T2(n1) SS2 E2(nk)) SS2 A2(k1)
相互独立
2020/10/17
理论证明
定理:在单因素析 方中 差, S分SA与SSE相互独立,
且SS2E~2(nk)当 . H0成立时SS, 2 A~2(k1),从而
F SSA(k1) ~F(k1,nk). SSE(nk)
2020/10/17
三、方差分析的原理
(三)方差的比较
▪ 如果不同颜色(水平)对销售量(结果)没有影响,那么在组
间方差中只包含有随机误差,而没有系统误差。这时,组 间方差与组内方差就应该很接近,两个方差的比值就会接 近1。
▪ 如果不同的水平对结果有影响,在组间方差中除了包含随
机误差外,还会包含有系统误差,这时组间方差就会大于 组内方差,组间方差与组内方差的比值就会大于1。
这意味着四个样本分别来自均值不同的四个正态总体
f(X)
2020/10/17
X
m3 m1 m2 m4
第二节 单因素方差分析
一、数据结构 二、单因素方差分析的步骤 三、单因素方差分析中的其它问题
f(X)
2020/10/17
X
m1 m2 m3 m4
一、数据结构
观察值 ( j )
1 2 : : n
看哪一个影响大?并需要知道 起显著作用的因素在什么时候 起最好的影响作用。
方差分析就是解决这 些问题的 一种有效方法。
2020/10/17
因素(因子)—— 可以控制的试验条件 因素的水平 —— 因素所处的状态或等级 单(双)因素方差分析——讨论一个(两个) 因素对试验结果有没有显著影响。
2020/10/17
例如:某厂对某种晴棉漂白工艺中酸液浓度(g/k)进 行试验,以观察酸液浓度对汗布冲击强力有无显著影 响。
冲击强力 序号
1
浓度
2 3 4 56
A1
16.2 15.1 15.8 14.8 17.1 15.0
A2
16.8 17.5 17.1 15.9 18.4 17.7
A3
19.0 20.1 18.9 18.2 20.5 19.7
水平A1
x11 x21 : : xn1
2020/10/17
因素(A) i
水平A2

x12

x22

:
:
:
:
xn2

水平Ak
x1k x2k : : xnk
二、单因素方差分析的步骤
(一)提出假设 (二)构造检验统计量 (三)统计决策
2020/10/17
二、单因素方差分析的步骤
(一)提出假设 1、一般提法
证明:对每个总 Xi(体 i 1,2,,k)的样本均X值i与样本方差
ni
(Xij Xi)2
Si2 j1 ni 1 相互独立;又全体相 样互 本独立,于是
n1
n2
nk
(X1, (X1j X1)2),(X2, (X2j X2)2),,(Xk, (Xkj Xk)2)
j1
j1
j1
相互独立; 2020/10/17
误差,则均值就是不相等的;反之,均值就 是相等的 (四)误差是由各部分的误差占总误差的比 例来测度的
2020/10/17
三、方差分析的原理
(一)两类误差
1. 随机误差
▪ 在因素的同一水平(同一个总体)下,样本的各观察值之间
的差异
▪ 比如,同一种颜色的饮料在不同超市上的销售量是不同的 ▪ 不同超市销售量的差异可以看成是随机因素的影响,或者
第四章 方差分析
第一节 方差分析的基本问题 第二节 单因素方差分析 第三节 双因素方差分析
2020/10/17
日常生活中经常发现,影 响一个事物的因素很多, 希望找到影响最显著的因 素
如某种农作物的收获量受作物品种、 肥料种类及数量等的影响;选择不同 的品种、肥料种类及数量进行试验,
2020/10/17
▪ H0: m1 = m2 =…= mk (因素有k个水平) ▪ H1: m1 ,m2 ,… ,mk不全相等
2、对前面的例子
▪ H0: m1 = m2 = m3 = m4
颜色对销售量没有影响
▪ H0: m1 ,m2 ,m3, m4不全相等
颜色对销售量有影响
2020/10/17
二、单因素方差分析的步骤
于是
n1
n2
nk
(X1, (X1j X1)2),(X2, (X2j X2)2),,(Xk, (Xkj Xk )2)
(二)构造检验统计量 1、为检验H0是否成立,需确定检验的统计量 2、构造统计量需要计算
▪ 水平的均值 ▪ 全部观察值的总均值 ▪ 离差平方和 ▪ 均方(MS)
2020/10/17
二、单因素方差分析的步骤
①假,定第从i个第总i个体总的体样中本抽均取值一为个该容样量本为的ni全的部简观单察随值机总样和本 除以观察值的个数
2020/10/17
二、单因素方差分析的步骤
实例
超市 (j)
四种颜色饮料的销售量及均值
水平A ( i ) 无色(A1) 粉色(A2) 橘黄色(A3) 绿色(A4)
1
26.5
31.2
27.9
30.8
2
28.7
28.3
25.1
29.6
3
25.1
30.8
28.5
32.4
4
29.1
27.9
24.2
31.7
三、方差分析的原理
(二)两类方差 1. 组内方差
▪ 因素的同一水平(同一个总体)下样本数据的方差 ▪ 比如,无色饮料A1在5家超市销售数量的方差 ▪ 组内方差只包含随机误差
2. 组间方差
相关主题