当前位置：文档之家› 方差分析

方差分析

• 3．2 固定效应模型 • 3．2．1 线性统计模型 • 在固定效应模型中， α i 是处理平均数与总平均数的离差，是个常量，因而 • ∑α i=0 I=1，2，…，n （3．2） • 要检验 α 个处理效应的相等性，就要判断各 α i 是否都等于 0 。若各 α i 都等于 0 ，则各处理效应之间无差异。因此，零假设为： • HO： α 1=α 2=...=α α =0 • 备择假设为： • HA： α i≠0（至少有1个i） • 若接受H0，则不存在处理效应，每个观测值都是由总平均数加上随机误差所构成。若拒绝H0，则存在处理效应，每个观测值是由总平均数、处理效应及误差三部分构成的。
自由度可以做同样的分割:自由度 dfT=an-1;A因素共有a水平，因而 dfA＝a－l；误差项有 α n－α 自由度，这是因为每一处理均有n － 1 自由度，共有 α 个处理，因而 dfe=α n－α 。为了估计 σ 2, 用 SSe除以相应的自由度 MSe=SSe/(an-a) （3．8） MSe称为误差均方（error mean sqare）。记MSA为处理均方， MSA=SSA/(α -1) （3．9） 3. 2. 3 均方期望与统计量F 可以由MSe的数学期望证明MSe是σ 2的无编估计量。误差均方反映了随机因素所造成的方差的大小，它是σ 2的无偏估计量。对于处理项来说，只有当零假设 HO：α 1=α 2= …=α i=0 成立时， MSa 才是 σ 2 的无偏估计量。当α i=0时，n/(α -1)∑α i2项等于 0，这时 E（MSA）＝σ 2 ，因此用 MSA与MSe比较，就可以反映出α i的大小。若 MSA与 MSe相差不大，就可以认为各α i与 0的差异不大，或者说各处理平均数（μ i）间差异不大。若 MSA比MSe超出很多，则认为μ i间差异是显著的。为此，用 F上尾单侧检验。 F=MSA/MSe，（3．10） Fα ,(dfA，dfe)
• 第二类处理效应称为随机效应（random effect），它是由随机因素（random factor）所引起的效应。若因素的α个水平，是从该因素水平总体中随机抽出的样本，则该因素称为随机因素。从随机因素α个水平所得到的结论，可以推广到这个因素的所有水平上。在这里αi是一个随机变量，所检验的是关于αi的变异性的假设。处理随机因素所用的模型称为随机效应模型（random effect model）或者简单地称为随机模型（random medel）。例 8．2的动物窝别，是从动物所有可能的窝别中随机选出来的，实验的目的是考查在窝别之间出生重是否存在差异，因而“窝别”是随机因素。
• 在表 3.5 中 SS: 平方和 , df: 自由度 , MS: 均方 F: 统计量 F 的计算值 P-value:概率 F crit: 在α 置信度和df 自由度的查表值。 • 由表3.5 中可以看出, F=42.27856 ,F crit=4.430717, F>F crit。因此，各处理间差异极显著（α =0.01）。习惯上用“* ”表示在α = 0.05水平上差异显著，用“**”表示在 α ＝0.01水平上差异显著，常常称为差异“极显著” （highly significant）。
第三章方差分析
第一节单因素方差分析 3. 1方差分析的基本原理 3．1．1方差分析的一般概念方差分析（analpeis Of vanance，ANOV）是一类特定情况下的统计假设检验，或者说是平均数差异显著性检验的一种引伸。 t检验可以判断两组数据平均数间的差异显著性，而方差分析则可以同时判断多组数据平均数之间的差异显著性。当然，在多组数据的平均数之间做比较时，可以在平均数的所有对之间做t检验。但这样做会提高犯I型错误的概率，因而是不可取的。例如，我们打算用一对一对比较的方法检验5个平均数之间的相等性，共需检验d=10对。假设每一对检验接受零假设的概率都是1-α=0.95，而且这些检验都是独立的，那么 10对都接受的概率是0.9510=0.5987，α`＝1-0.60=0.40，犯I型错误的概率明显增加。用方差分析的方法做检验可以防止上述问题的出现。方差分析的内容很广泛，上面讲到的那种情况是方差分析中最简单的情况，称为单因素方差分析（one—factor analyss of vcriance）或者称为一种方式分组的方差分析（one-- way classification analysis of vanance）。
• 3.2.4 方差分析的数据分析工具操作步骤 • 在例3.1中有5个处理，每个处理的重复次数相同（可以不同，操作相同）为5。 • 操作步骤： • 1．单击工具菜单中的数据分析 • 2．双击分析工具列表中的“单因素方差分析”，出现如图3.1 • 3 ．选择各个选项，单击确定，计算结果如表 3.5 • 注意分组方式指出重复处理的数据是以行或是以列排列，本例（如图3.1）以列排列。 •
• 表3. 3 单因素方差分析的典型数据 X1 X2 X3……Xi……Xa 1 X11 X12 X13 Xi1 Xa 2 X12 X22 X32 Xi2 Xa2 3 X13 X23 X33 Xi3 Xa3 . . . . j X1j X2j X3j Xij Xaj . . . . . . n X1n X2n X3n Xin Xan 平均数 X1. X2. X 3. X i. X a . • • 表中的数据Xij，表示第i次处理下的第j次观测值。
例 3.1 调查了 5 个不同小麦品系的株高，结果列于表 3.1 。判断这 5 个样本是否存在差异。
表3.1 5个小麦品系株高（cm）调查结果品系株号 I II III IV V 1 64.6 64.5 67.8 71.8 69.2 2 65.3 65.3 66.3 72.1 68.2 3 64.8 64.6 67.1 70.0 69.8 4 66.0 63.7 66.8 69.1 68.3 5 65.8 63.9 68.5 71.0 67.5 方差分析.xls
• 例3.2 为了探讨不同窝的动物出生重是否存在差异，随机选取4窝动物，每窝中均有4只幼仔，结果如下，通过对以上数据的分析，判断不同窝别动物出生重是否存在差异。 • 窝别 • 动物号 I II III IV •1 34.7 33.2 27.1 32.9 •2 33.3 26.0 23.3 31.4 •3 26.2 28.6 27.8 25.7 •4 31.6 32.3 26.7 28.0 • 方差分析.xls
• 当 F＜Fα 时，则可以认为 MSA 与 MSe 差异不大，产生的变差是由随机误差造成的，n/(α -1)∑α i2 近于 0，接受零假设，处理平均数之间差异不显著。当 F＞Fα 时， MSe,显著高于MSe，n/(α -1)∑α i2 项不再为0，拒绝零假设，处理平均数间差异显著。 • 以上所述可以归纳成方差分析表，见表 3.4。 • 表3.4单因素固定效应模型方差分析表 • 变差来源平方和自由度均方 F • 处理间 SSA α -1 MSA F=MSA/MSe • 误差 SSe α (n-1) MSe • 总和 SST nα -方差分析的基本思想，就是将总的变差分解为构成总变差的各个部分。对单因素实验，总平方和（total sm of sqares）表示如下： • ∑∑(xij-x..)2 （3.3） • 其中 x..表示总体平均值。总平方和可以分解为处理平均数与总平均数之间离差的平方和及处理内部观测值与处理平均数之间离差的平方和两部分。处理平均数与总平均之间的离差，度量了处理之间的差异；而处理内部观测值与处理平均数之间的离差，度量了随机误差的大小。 • 用SST表示总平方和， • SST=∑∑(xij-x..)2 (3. 4) • =∑∑((xij-x.i)+(x.i-x..))2 • = ∑∑(xij-x.i) 2 + ∑∑(x.i-x..))2 +2∑∑ (xij-x.i)(x.i-x..) • ∑∑ (xij-x.i)(x.i-x..)=∑(x.i-x..)∑(xij-x.i) • = n∑(x.i-x..) (x.i-x.i) • =0 • SSA 称为处理平方和（ treatlnnts sm of apares）或称为处理间平方和（ sm of mpares betwee treaments）。 • SSA= n ∑(xi.-x..)2 (3．5) • 其中 xi. 表示 i处理的平均值。 • SSe 称为误差平方和（ error sm of sqares）或称为处理内平方和 ( sm of sqares within treatment)。 • SSe=∑∑（xij-xi.）2 (3. 6) • 因此 • SST=SSA+SSe （3．7）
• 上述模型中，包括两类不同的处理效应。 • 第一类处理效应称为固定效应（fixed effect），它是由固定因素（fixed factor）所引起的效应。若因素的 α 个水平是经过特意选择的，则该因素称为固定因素。例如，实验者人为选定的几种不同实验温度、几种不同化学药物或一种药物的几种不同浓度、几个作物品种以及几种不同的治疗方案和治疗效果等。在这些情况中，因素的水平是人为选定的，所检验的是关于 n 的假设，因此温度、药物、浓度、品种等称固定因素。方差分析所得到的结论只适合于选定的那几个水平，并不能将结论扩展到未加考虑的水平上。处理固定因素所用的模型称为固定效应模型（fixed effect model）或简单地称为固定模型（fixed model）。例 3.1中的5个小麦品系是特意选择的，目的是从这 5 个品系中，选出最优者，因而“品系”这个因素属于固定因素，所使用的模型是固定效应模型。
• 随机因素的水平是不能严格地人为控制的，在水平确定之后，它的效应值并不固定。例如，在研究农家肥不同施用量对作物产量的影响试验中，农家肥是因素，不同施用量是该因素的不同水平，作物的产量是它的效应值。由于农家肥的有效成分很复杂，不能像控制温度那样，将农家肥的有效成分严格地控制在某一个固定值上。在重复试验时即使施以相同数量的肥料，也得不到一个固定的效应值。即在因素的水平（施肥量）固定之后，它的效应值（产量）并不固定，因而农家肥是一随机因素。

e商务文档

方差分析

相关文档推荐：