当前位置:文档之家› 第五章 方差分析

第五章 方差分析


5.2.1 方差分析的假定 (1)对每个总体,响应变量服从正态分布。 例题中,每组学生的考试成绩必须服从正态 分布。 (2)响应变量的方差,对所有总体都相同。 例题中,每组学生的考试成绩的方差必须相 同。 (3)观察值必须是独立的。例题中,每组的 考试每个学生的考试成绩都与其他学生的考 试成绩独立。
2 302.4667 4.256098
12 71.06667 14
练习:某项研究报告得出这样的结论:个体经营 者感受到的工作压力要比非个体经营者大。在该 项研究中,为了度量一些模棱两可和容易混淆的 方面,设计了15个问题来评估工作压力。这15 个问题的选择范围都是从强烈同意到强烈反对, 等级分为1-5分。对每个人,15个问题的等级分 之和在15-75之间,等级分越高表明工作压力越 大。假设在一项类似的研究中,有20个这样的 选择题,等级分为1-5分。随机选取了15名房地 产代理商、15名建筑商和15名股票经纪人,对 他们的工作压力进行了度量。数据资料见 stress.xls。对于显著水平0.05,检验三种职业之 间的工作压力是否存在显著差异。
第五章 方差分析
5.1 方差分析的基本概念
5.2 方差分析的基本原理
5.3 方差分析:k个总体均值相等性检验
5.1 方差分析的基本概念
在实际应用中常常要探讨不同实验条件 或处理方法对结果的影响。通常是比较不同 实验条件下总体均值间差异。方差分析是检 验多个总体均值间差异是否显著的一种统计 方法。 简言之,方差分析是k个总体均值相等性 的检验 。
5.3 方差分析:k个总体均值相等性检验
H 0 : 1 2 k H1 : k 个总体的均值不全相等 式中
j 第j个总体的均值
我们假定从k 个总体或处理中的每一个选取一个 容量为n j的简单随机样本。 对于所得样本数据,令 xij 第j个处理的第i个观测值 n j 第j个处理的观测值个数 x j-第j个处理的样本均值 s 2 第j个处理的样本方差 j s j 第j个处理的的样本标准差
例:为了比较四种不同肥料对小麦亩产量的影响, 取一片土壤肥沃程度和水利灌溉条件差不多的土地, 分成16块。化肥品种记为A1 ,A2 ,A3 ,A4,每种肥 料施在四块土地上,得亩产量如下:
实验指标
肥料品种A
A1 A2 A3 A4

亩产量 981,964,917,669 607,693,506,358 791,642,810,705 901,703,792,883
图1 零假设为真时,样本均值的抽样分布
现在,我们计算例题中每组的样本均值,以 及上面关于样本均值的抽样分布的均值和方 差。 如果当零假设为真时,此时总体方差的处理 间估计值是什么呢?总体方差的处理内估计 值是什么呢?
图1 零假设为假时,样本均值的抽样分布
当零假设为真时,处理间估计方法才是总 体方差σ2的一个好的估计量;如果零假设为 假,处理间估计方法将高估总体方差,如图2, 样本均值之间的变异性变大,此时用处理间 估计方法得到的总体方差的估计值将变大。 但,在两种情形下,处理内估计都是总 体方差σ2的一个好的估计量。 因此,如果零假设为真,则两个估计量 应该很接近,即它们的比值接近于1;如果零 假设为假,则处理间估计将大于处理内估计, 且,它们的比值将比较大。
第j个处理的样本均值和样本方差:
xj
x
i 1
nj
ij
nj ( xij x j ) 2
i 1 nj
s2 j
nj 1

x
x
j 1 i 1
ห้องสมุดไป่ตู้
k
nj
ij
nT
nT n1 n2 nk
5.3.1 总体方差的处理间估计
总体方差σ2的处理间估计量称为处理均方 (mean square due to treatments),记为MSTR.
方差分析中常用的术语有: (1)实验指标(响应变量或因变量):将要考 察的结果,用大写字母X、Y等表示。 (2)实验因素(自变量或因子):影响实验指 标的条件,常用大写字母A、B、 C等表示。 (3)因素水平(因子水平或处理):因素所处 的某种特定状态,常用代表该因素 的字母加下 标表示,如A1、A2、B1、B 2等表示。 (4)方差分析:对于影响一个指标的众多因素, 若仅使一个(或一个以上)因素发生变化,而其他 因素均保持不变 (或控制在一定范围内),分析这 一个(或一个以上)因素对指标的影响是否显著, 称为单因素(或多因素)方差分析。
MSTR
n j ( x j x )2
j 1
k
k 1
SSTR k 1
SSTR为处理平方和(sum of squares due to treatments);分母k-1表示与SSTR相联系的自 由度。
5.3.2 总体方差的处理内估计
总体方差σ2的处理内估计量称为误差均方(mean square due to error),记为MSE.
B2
607,358 981,964 810,705 657,703
B3
实验因素
810,705
因素水平
792,883 843,766 901,703
问施肥品种、土壤种类对小麦产量有无影响。
两因素方差 分析
5.2 方差分析的基本原理
例:一位教师采用3种不同的教学方法进行教 学,现在想要检查3种不同的教学方法的效果, 为此随机地选取了水平相当的15位学生。把 他们分成3组,每组5个人,每一组用一种方 法教学,一段时间后,这位教师给这15位学 生进行统考,统考成绩(单位:分)见表1。试 检验这3种教学方法的效果有没有显著差异。
MSE
(n
j 1
k
j
1) s
2 j
nT k
SSE nT k
SSE为误差平方和(sum of squares due to error); 分母表示与SSE相联系的自由度。MSE是以每个 处理内部的变异为基础的,它不受零假设是否为 真的影响。因此,MSE永远给出σ2的无偏估计。

表1 学生的考试成绩
方法
A1 1 A2 2 A3 3
实验指标 X
统考成绩
75 81 73 62 85 79 71 68 60 58 92 75 73 90 81
5.2.2 推理思路: 总体方差的处理间估计与处理内估计 如果零假设为真,样本均值的变异性 “小”;如果样本均值的变异性“大”则支 持备择假设。 当零假设为真时,可以利用样本均值间的 变异性建立σ2的一个估计,这一估计称为总 体方差σ2 的处理间估计。 同时,每个样本方差都给出了σ2的一个无 偏估计。可以将σ2的个别估计组合或合并成 一个总的估计。这一估计为σ2的合并或处理 内估计。它不受总体均值是否相等的影响。
实验因素
因素水平
问施肥品种对小麦产量有无影响。
单因素方差分析
例:为了比较四种不同肥料、三种土壤对小麦亩产量的 影响,化肥品种为A1 ,A2 ,A3 ,A4,土壤记为B1, B2,B3每种肥料施在四块土地上,得亩产量如下:
土壤种类 肥料品种 A1 A2 A3 A4
实验指标
B1
693,506 810,705 791,642 917,669
5.3.3 方差估计量的比较:F检验

5.3.4 ANOVA表
总平方和:
SST ( xij x )
j 1 i 1
k
nj
2
它的自由度是多少?
SST = SSTR + SSE
表2 教学方法例子的方差分析表
方差来源 平方和 自由度 均方 F
处理
误差 总计
604.9333
852.8 1457.733
相关主题