第三章 方差分析
Aa
N (a, 2 )
ya1, ya2 , , yana
令εij=yij-μi,称εij为随机误差,则εij ~N(0,σ2)
则有(相当于个回归模型)
yij i ij , j 1 ~ ni , i 1 ~ a
ij
~
N
(0,
2
),
且诸 相互独立 第三章 方i差j 分析
(3.1)
2021/3/6
10
称
n
n i 1
ni为总容量;
1 n
n i 1
ni i
为总平均;
i i , i 1 ~ a 为水平Ai的效应(影响度)
反映了因素A的第i水平Ai对Y的影响大小且满足
a
nii 0
模型(3.1)可改写为: i1
yij i ij , j 1 ~ ni , i 1 ~ a
ij ~ N (0, 2 ),且诸ij相互独立
样本:在同样条件下得到不同的实验结果每个结果,称为样本。
第三章 方差分析
2021/3/6
7
B1,B2,B3,B4
3.1 单因素方差分析
方差分析中,Y是某个数量指标是计量变量, 对Y的取值可能会产生影响的定性变量为因素, 用A,B,C表示.
因素水平:各因素所处的不同状态;
因素A的a个水平: A1, A2 , , Aa
例如某农作物产量Y, 作物品种A, 化肥品种B
A1, A2 , A3 B1, B2 , B3, B4
思想:显著性检验, 即 Y的总变化量=各因素各水 平及交互影响+随误影响,通过比较二者的相对 大小来确定各因素及交互作用对Y影响是否显著
第三章 方差分析
2021/3/6
8
3.1.1. 单因素方差分析模型
(3.2)
a
nii 0
i 1
第三章 方差分析
2021/3/6
11
(一)参数估计
即通过实验估计μ和{ai},其估计量记为和μ和{ai} 令
则
i
1 ni
ni
ij
j 1
1 ani
a i 1
ni
ij
j 1
Xi
1 ni
ni j 1
X ij
1 ni
ai ij ai i
X 1 ani
某种新药与其它一些传统药物对病人进行分组实验来 考查不同的药物与治愈率有否明显不同,这里我们考 查的对象,原料,药物称为因素.
当考查的因素只有一个时我们称为单因素问题。如果 同时考虑两个或更多的因素问题,则称多因素方差分 析(这时计算起来很复杂)。
第三章 方差分析Βιβλιοθήκη 2021/3/64
例:考查温度对某一化工厂产品得率的影响,选了五种不 同温度,同一温度做了三次试验,测得结果如下:
上例全部15个数据参差不齐,它们的差异叫总变差。产生总变差 的原因有两个
1) 随机误差 2) 系统误差
第三章 方差分析
2021/3/6
6
方差分析解决这类问题的思想是:
l 由数据的总变差中分离出随机误差和系统误差。
l 用系统误差和随机误差在一定条件下进行比较,如差异不大 则认为系统误差对指标的影响不大,如系统误差比随机误差大的 多,则说明条件的影响很大。以上面的例子说明即温度的变化对 得率的影响很大,因此调整温度对产量的影响很大。
l 选择较好的工艺条件或确定进一步的实验方案。
这里介绍几个方差分析术语:
因素:实验中的每一个条件,如上例的温度便是一个因素。
水平:因素在实验中的等级称为水平,如上例中因素温度分为五 个水平:60℃65℃,70℃,75℃,80℃。如果把因素记为A,则 相应地把水平记为A1, A2, A3, A4, A5.
有相同的方差,因素A的各水平的影响只体现在 各总体均值的差异上。
第三章 方差分析
2021/3/6
9
i 1~a
• 假设如下表: (各样本独立, 同方差)
yij ~ N(i , 2 )
因素A的水平 总 体
样本
A1 A2
N (1, 2 ) N (2, 2 )
y11, y12 , , y1n1 y21, y22 , , y2n2
a i 1
ni j 1
ai ij
第三章 方差分析
2021/3/6
12
取 X 是μ的一个无偏估计。
a aˆ 类似地可以推出 i 的无偏估计是 i
aˆi X i X
此时方差分析模型可以改写为:
Xij X aˆi lij
l aˆ l ij 反映了误差 ij 。由于 X ij,X , i 均为已知故 ij
第三章 方差分析
2021/3/6
5
现在分析温度的变化对得率的影响。从平均得率来看,好象温度 对得率是有一定的影响,但详细观察一下数据就会发现问题,表现 在:
(1)同一温度下得率并不完全一样,产生这种差异的原因是由于 试验过程中各偶然因素的干扰及测量误差所致,这一类误差称为试 验误差,或随机误差。
(2)两种温度的率不同的试验中的倾向有所差别。如65℃与 70℃相比,第一产65℃比70℃好,而后二次70℃比65℃好。产生 这种矛盾现象,显然也可能是由于随机误差的干扰。由于随机误差 的存在,对于不同温度下的得率的差异自然要提出疑问,这差异是 随机误差造成的呢,还是温度不同的影响。由于温度的不同而引起 得率的差异我们称为组间误差或系统误差。
定性变量的取值只能用语言或代号标明它的 属性或者即使给这些就是赋予数值,只是为 标记方便,称为因素
基于不同的数据分析目的,可将定量变量转 化为定性变量。
方差分析: 因素取不同状态时, 对因变量的影 响是否显著.
第三章 方差分析
2021/3/6
3
经常遇到这样的问题,有几种不同的原料,要考查它 们对产品质量有没有显著的影响。
单因素方差分析即只考虑一个因素情况下的 方差分析方法.
设所关心变量为Y,影响的因素为A,有a个水平 A1,A2,…,Aa,在A的各水平上对Y进行独立观测, 在Ai上对Y独立观测ni次,观测值为yi1,…,yini,并 设其独立同分布于某个正态分布。
不同水平上的各组观测值被认为是来自不
同正态总体的一个样本,并假定除A可在其水平 上变动外,其他条件不变,进一步假设各总体具
第三章 方差分析
第三章 方差分析
3.1 单因素方差分析 3.1.1. 单因素方差分析模型 3.1.2. 因素效应的显著性检验 3.1.3. 因素各水平均值的估计与比较
第三章 方差分析
2021/3/6
2
3.1 单因素方差分析
变量分为两大类:定量变量与定性变量;
定量变量就是它的取值可以量化,分为取值 连续的计量变量和取值离散的计数变量;