当前位置:文档之家› 方差分析

方差分析


• 3.2 固定效应模型 • 3.2.1 线性统计模型 • 在固定效应模型中, α i 是处理平均数与总平均数 的离差,是个常量,因而 • ∑α i=0 I=1,2,…,n (3.2) • 要检验 α 个处理效应的相等性,就要判断各 α i 是否都 等于 0 。若各 α i 都等于 0 ,则各处理效应之间无差异。 因此,零假设为: • HO: α 1=α 2=...=α α =0 • 备择假设为: • HA: α i≠0(至少有1个i) • 若接受H0,则不存在处理效应,每个观测值都是由总平 均数加上随机误差所构成。若拒绝H0,则存在处理效应, 每个观测值是由总平均数、处理效应及误差三部分构成 的。
自由度可以做同样的分割:自由度 dfT=an-1;A因素共有a水平,因而 dfA=a-l;误差项有 α n-α 自由度,这是因为每一处理均有n - 1 自由度,共有 α 个处理,因而 dfe=α n-α 。为了估计 σ 2, 用 SSe除以相应的自由度 MSe=SSe/(an-a) (3.8) MSe称为误差均方(error mean sqare)。记MSA为处理均方, MSA=SSA/(α -1) (3.9) 3. 2. 3 均方期望与统计量F 可以由MSe的数学期望证明MSe是σ 2的无编估计量。误差均方反映 了随机因素所造成的方差的大小,它是σ 2的无偏估计量。对于处理 项来说,只有当零假设 HO:α 1=α 2= …=α i=0 成立时, MSa 才是 σ 2 的无偏估计量。当α i=0时,n/(α -1)∑α i2项等于 0,这时 E(MSA) =σ 2 ,因此用 MSA与MSe比较,就可以反映出α i的大小。若 MSA与 MSe相差不大,就可以认为各α i与 0的差异不大,或者说各处理平 均数(μ i)间差异不大。若 MSA比MSe超出很多,则认为μ i间差异 是显著的。为此,用 F上尾单侧检验。 F=MSA/MSe, (3.10) Fα ,(dfA,dfe)
• 第二类处理效应称为随机效应(random effect), 它是由随机因素(random factor)所引起的效应。 若因素的α个水平,是从该因素水平总体中随机 抽出的样本,则该因素称为随机因素。从随机因 素α个水平所得到的结论,可以推广到这个因素 的所有水平上。在这里αi是一个随机变量,所检 验的是关于αi的变异性的假设。处理随机因素所 用的模型称为随机效应模型(random effect model)或者简单地称为随机模型(random medel)。例 8.2的动物窝别,是从动物所有可 能的窝别中随机选出来的,实验的目的是考查在 窝别之间出生重是否存在差异,因而“窝别”是 随机因素。
• 在表 3.5 中 SS: 平方和 , df: 自由度 , MS: 均方 F: 统计量 F 的计算值 P-value:概率 F crit: 在α 置信度和df 自由度的查表值。 • 由表3.5 中可以看出, F=42.27856 ,F crit=4.430717, F>F crit。因此,各 处理间差异极显著(α =0.01)。 习惯上用“* ”表示在α = 0.05水平上差 异显著,用“**”表示在 α =0.01水平上差异显著,常常称为差异“极显著” (highly significant)。
第三章 方差分析
第一节 单因素方差分析 3. 1方差分析的基本原理 3.1.1方差分析的一般概念 方差分析(analpeis Of vanance,ANOV)是一类特定情况下 的统计假设检验,或者说是平均数差异显著性检验的一种引伸。 t检验可以判断两组数据平均数间的差异显著性,而方差分析则 可以同时判断多组数据平均数之间的差异显著性。 当然,在多组数据的平均数之间做比较时,可以在平均数的 所有对之间做t检验。但这样做会提高犯I型错误的概率,因而是 不可取的。例如,我们打算用一对一对比较的方法检验5个平均 数之间的相等性,共需检验d=10对。假设每一对检验接受零假设 的概率都是1-α=0.95,而且这些检验都是独立的,那么 10对都接 受的概率是0.9510=0.5987,α`=1-0.60=0.40,犯I型错误的概率明 显增加。用方差分析的方法做检验可以防止上述问题的出现。方 差分析的内容很广泛,上面讲到的那种情况是方差分析中最简单 的情况,称为单因素方差分析(one—factor analyss of vcriance) 或者称为一种方式分组的方差分析(one-- way classification analysis of vanance)。
• 3.2.4 方差分析的数据分析工具操作步骤 • 在例3.1中有5个处理,每个处理的重复次数相同 (可以不同,操作相同)为5。 • 操作步骤: • 1. 单击工具菜单中的数据分析 • 2. 双击分析工具列表中的“单因素方差分析”, 出现如图3.1 • 3 . 选择各个选项,单击确定,计算结果如表 3.5 • 注意 分组方式指出重复处理的数据是以行或是 以列排列,本例(如图3.1)以列排列。 •
• 表3. 3 单因素方差分析的典型数据 X1 X2 X3……Xi……Xa 1 X11 X12 X13 Xi1 Xa 2 X12 X22 X32 Xi2 Xa2 3 X13 X23 X33 Xi3 Xa3 . . . . j X1j X2j X3j Xij Xaj . . . . . . n X1n X2n X3n Xin Xan 平均数 X1. X2. X 3. X i. X a . • • 表中的数据Xij,表示第i次处理下的第j次观测值。
例 3.1 调查了 5 个不同小麦品系的株高, 结果列于表 3.1 。判断这 5 个样本是否存 在差异。
表3.1 5个小麦品系株高(cm)调查结果 品 系 株号 I II III IV V 1 64.6 64.5 67.8 71.8 69.2 2 65.3 65.3 66.3 72.1 68.2 3 64.8 64.6 67.1 70.0 69.8 4 66.0 63.7 66.8 69.1 68.3 5 65.8 63.9 68.5 71.0 67.5 方差分析.xls
• 例3.2 为了探讨不同窝的动物出生重是否存 在差异,随机选取4窝动物,每窝中均有4只 幼仔,结果如下,通过对以上数据的分析, 判断不同窝别动物出生重是否存在差异。 • 窝 别 • 动物号 I II III IV •1 34.7 33.2 27.1 32.9 •2 33.3 26.0 23.3 31.4 •3 26.2 28.6 27.8 25.7 •4 31.6 32.3 26.7 28.0 • 方差分析.xls
• 当 F<Fα 时,则可以认为 MSA 与 MSe 差异不大,产生的 变差是由随机误差造成的,n/(α -1)∑α i2 近于 0,接 受零假设,处理平均数之间差异不显著。当 F>Fα 时, MSe,显著高于MSe,n/(α -1)∑α i2 项不再为0,拒绝零 假设,处理平均数间差异显著。 • 以上所述可以归纳成方差分析表,见表 3.4。 • 表3.4单因素固定效应模型方差分析表 • 变差来源 平方和 自由度 均方 F • 处理间 SSA α -1 MSA F=MSA/MSe • 误差 SSe α (n-1) MSe • 总和 SST nα -方差分析的基本思想,就是将总的变差分解为构成总变差的各个部分。对单因素 实验,总平方和(total sm of sqares)表示如下: • ∑∑(xij-x..)2 (3.3) • 其中 x..表示总体平均值。总平方和可以分解为处理平均数与总平均数之间离差的平 方和及处理内部观测值与处理平均数之间离差的平方和两部分。处理平均数与总平均 之间的离差,度量了处理之间的差异;而处理内部观测值与处理平均数之间的离差, 度量了随机误差的大小。 • 用SST表示总平方和, • SST=∑∑(xij-x..)2 (3. 4) • =∑∑((xij-x.i)+(x.i-x..))2 • = ∑∑(xij-x.i) 2 + ∑∑(x.i-x..))2 +2∑∑ (xij-x.i)(x.i-x..) • ∑∑ (xij-x.i)(x.i-x..)=∑(x.i-x..)∑(xij-x.i) • = n∑(x.i-x..) (x.i-x.i) • =0 • SSA 称 为 处 理 平 方 和 ( treatlnnts sm of apares) 或 称 为 处 理 间 平 方 和 ( sm of mpares betwee treaments)。 • SSA= n ∑(xi.-x..)2 (3.5) • 其中 xi. 表示 i处理的平均值。 • SSe 称 为 误 差 平 方 和 ( error sm of sqares) 或 称 为 处理 内 平 方 和 ( sm of sqares within treatment)。 • SSe=∑∑(xij-xi.)2 (3. 6) • 因此 • SST=SSA+SSe (3.7)
• 上述模型中,包括两类不同的处理效应。 • 第一类处理效应称为固定效应(fixed effect),它是 由固定因素(fixed factor)所引起的效应。若因素的 α 个水平是经过特意选择的,则该因素称为固定因素。 例如,实验者人为选定的几种不同实验温度、几种不同 化学药物或一种药物的几种不同浓度、几个作物品种以 及几种不同的治疗方案和治疗效果等。在这些情况中, 因素的水平是人为选定的,所检验的是关于 n 的假设, 因此温度、药物、浓度、品种等称固定因素。方差分析 所得到的结论只适合于选定的那几个水平,并不能将结 论扩展到未加考虑的水平上。处理固定因素所用的模型 称为固定效应模型(fixed effect model)或简单地称 为固定模型(fixed model)。例 3.1中的5个小麦品系 是特意选择的,目的是从这 5 个品系中,选出最优者, 因而“品系”这个因素属于固定因素,所使用的模型是 固定效应模型。
• 随机因素的水平是不能严格地人为控制的,在 水平确定之后,它的效应值并不固定。例如,在 研究农家肥不同施用量对作物产量的影响试验中, 农家肥是因素,不同施用量是该因素的不同水平, 作物的产量是它的效应值。由于农家肥的有效成 分很复杂,不能像控制温度那样,将农家肥的有 效成分严格地控制在某一个固定值上。在重复试 验时即使施以相同数量的肥料,也得不到一个固 定的效应值。即在因素的水平(施肥量)固定之 后,它的效应值(产量)并不固定,因而农家肥 是一随机因素。
相关主题