当前位置:文档之家› 第3章方差分析

第3章方差分析

第3章方差分析
方差分析:通过观测数据对因素的影响大小作出
合理推断。

方差分析种类:
◆单因素方差分析
◆两因素方差分析
▲无交互作用的两因素方差分析
▲有交互作用的两因素方差分析
◆三因素方差分析
1
2
一、单因素方差分析
1,,r A r A A 因素的个不同水平用表示.
方差分析的目的是在众多因素中找出有显著影响的因素,为此需要做试验,试验中可以变化的、影响试验指标的因素称为因素,用大写字母A 、B 、C 、……表示,因素在试验中所取的不同状态称为水平.方差分析是检验同方差的若干正态总体均值是否相等的一种统计分析方法。

3
检验问题:22~(,)1,2,,;1,2,,,i j i i j i i X N X i r j n μσμσ⎧⎪⎪==⎨⎪⎪⎩
相互独立,未知0111::,,r r H H μμμμ==↔ 不全相同设因素A 有r 个不同水平A 1、…Ar ,在A i 下试验结果X i ~N (µi ,σ2), i =1 , …, r 。

在A i 下做n i (≥2)次试验,相当于从总体X i 中抽取了一组样本X i 1, …, X i n i ,他们相互独立,故方差分析模型为:
若拒绝H 0,则表示因素A 显著,否则为不显著。

10例1某厂家为考察某种家电的广告内容对其销售量
的影响,在其他条件尽量不变的情况下,设计了三种不同内容的广告:广告A 1强调安装方便性;广告A 2强调能耗经济性;广告A 3强调低噪性。

在广告被广泛宣传后,按寄回的广告上的订购数计算,一年四个季度的销售量见下表:
Matlab统计工具箱中单因素方差分析的命令是anoval
各组数据个数相等(均衡数据)时用法:p=anoval(x)

返回值p是一个概率,当p>α时接受H
x为n×r的数据矩阵(如上面的单因素试验数据表形式),
x的每一列是一个水平的数据。

另外,还给出一个方差表和一个Box图
各组数据个数不相等时用法:p=anova1(x,group) x为数组,从第1组到第r 组数据依次排列;
group为与x同长度的数组,标志x中数据的组别
(在与x第i组数据相对应的位置处输入整数i (i=1,…,r) )
13
14
x=[ 163 184 206
176 198 191170 179 218185 190 224 ];p=anova1(x)
编写程序如下运行结果
求得p=0.0039<0.05,故拒绝H 0 ,即认为广告内容的不同对销售量的影响是很大的。

17
x= [ 1620 1580 1460 1500
1670 1600 1540 15501700 1640 1620 16101750 1720 1680 1800 ];
x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];
g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)];p=anova1(x,g)
求得0.01<p=0.0331<0.05,所以几种工艺制成的灯泡寿命在显著水平α=0.01下无显著差异,但在显著水平α=0.05
下有显著差异
28(二)有交互作用的两因素方差分析
1.i j i j
μμαβ≠++数学模型为对(Ai ,B j )的每个组合至少做t (≥2 ) 次试验,试验结果X ijk
1,1,1i r j s k t
≤≤≤≤≤≤有交互作用的方差分析模型:
21
1112,~..(0,)
0,0,1,1,,,,i j k i j i j i j k i j k r s r s i i i j i j i j i j i j i j X r i i d N r r i r j s
r μαβεεσαβμαβσ====⎧=++++⎪⎪
====≤≤≤≤⎨⎪⎪⎩
∑∑∑∑未知
i j i j i j i j i j i j
r A i B j r μμαβμμαβ=−−−=+++称为因素的第个水平与因素的第个水平的交互效应,这时
例4在某化工厂生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。

在同一浓度和温度组合下各做两次试
验,其收率数据如下计算表所列(数据
均已减75)。

试在显著性水平(α=0.05)
下检验不同浓度、不同温度以及它们之
间的交互作用对收率有无显著影响。

33
例5 一个超市将一种商品采用3种不同的包装,放在3个不同的货架上作销售试验,
希望检验不同的包装、不同货架对销售
量是否有显著影响,交互作用显著,随
机地抽取3天的销售量作样本,取检验水
平α=0.05,其观测结果如下表:
37
40
Matlab 实现: 命令为p=anova2(x,reps)
其中x 不同列的数据表示单一因素的变化情况,不同行中的数据表示另一因素的变化情况。

如果每种行-列对(“单元”)有不止一个的观测值,则用参数reps 来表明每个“单元”多个观测值的不同标号,即reps 给出重复试验的次数t 。

下面的矩阵中,列因素有3种水平,行因素有两种水平,但每组水平有两组样本,相应地用下标来标识
⎥⎥
⎥⎥⎦

⎢⎢⎢⎢⎣⎡232222
212
231221211132122112131121111x x x x x x x x x x x x
clc,clear
x0=[5 6 4 6 8 7 4 3 5
7 8 8 5 5 5 3 6 4
3 2
4 6 6
5 8 9 6];
x1=x0(:,1:3:7);x2=x0(:,2:3:8);x3=x0(:,3:3:9);
for i=1:3 Array x(3*i-2,:)=x1(i,:);
x(3*i-1,:)=x2(i,:);
x(3*i,:)=x3(i,:);
end
p=anova2(x,3)
求得p=0.352 0.7815 0,表明货物的包装及放的货架
这两个因素试验均值相等的概率不是小概率,故可接受均
值相等假设。

但两者交互作用显著.
41
42
三、三因素方差分析
因素A 取r 个不同水平A 1,…,A r ;因素B 取s 个不同水平B 1,…,B s ;因素C 取t 个不同水平C 1,…,C t ;(A i , B j , C k ) 组合下重复q 次试验,试验结果X i jkl ~ i.i.d.N (u i j k
,σ2)
46
1(1)(1)(1)(1)(1)(1)(1)(1)(1)(1)
AB AC BC AB C e n rstq n r s n r t n s t n r s t n rst q =−=−−=−−=−−=−−−=−
48
例6某集团为研究销售点所在地理位置、销售点处的广告和销售点的装潢这三个因素对商品销售量的影响程度,选了三个位置(如市中心黄金地段、非中心地段、城乡结合部),两种广告形式,两种装潢档次在四个城市进行了搭配试验。

用A 1,A 2,A 3表示三种位置,B 1,B 2代表两种广告形式,C 1,C 2表示装潢档次,它们分别称为A 、B 、C 三种因素。

每个组合在四个城市的销售量的统计数据如下:
问:哪种组合对销售量的影响显著,即
何种组合对增加销售量效果最好,位
置、广告、装潢这三个因素中哪一个对
销售量影响最大?
50。

相关主题