当前位置：文档之家› 统计学：方差分析

统计学：方差分析

x
S
4.29
5.44
3.93
6.55
4.83
4.86
3.88
3.89
5.38
4.08
2 两两比较的t检验的比较次数为：m C10 45 次
若 0.05， 45次中恰有5次有统计学意义的结果
比较组 1 与3 1与6 1与7 1与9 1与10
t
P
2.601
0.013
2.329
0.025
2.372
0.023
2.272
0.029
2.918
0.006
实际上犯第一类错误的概率为5/45≈0.11>0.05。理论上，4ቤተ መጻሕፍቲ ባይዱ次同时不犯第一类错误的概率为（1﹣0.05）45 = 0.09944，而犯第一类错误的概率为 1﹣ （1﹣0.05）45 =
0.90055
t 检验两两比较的精确性和检验的灵敏性低
第一节完全随机设计资料的ANOVA 一、方差分析的基本思想
方差分析的基本思想是将所有观察值之间的变异（称为总变异）按设计和需要分解成
几部分。如:
完全随机设计资料的ANOVA，将总变异分解为组间变异和组内变异两部分，后者称为误差：
总变异 = 本质上的差别（组间差异）
+
抽样误差（组内差异）
由于ANOVA是根据试验设计将总变异分成若干部分，因此设计时考虑的因素越多，变异划分的越精细，各部分变异的涵义越清晰明确，结论的解释也越容易。同时由于变异划分精细，误差部分减小，提高了检验的灵敏度和结论的准确性。方差分析的基本思想是：按造成数据变异的来源分解离均差平方和与自由度，然后借助F
在。而第二种原因是否存在，这正是假设检验要回答的问题。
多组资料均数比较不宜用两样本t 检验进行两两比较，否则会增大犯第
一类错误的概率。
计算机模拟两两比较的第一类错误
表9-2
样本号 1 12.61 2 10.85
从已知总体N（10，52）随机抽取10个样本（ni=20）的结果
3 9.23 4 9.11 5 10.90 6 9.24 7 9.55 8 10.28 9 9.12 10 8.75
ANOVA的假设： H0：k 组总体均数相等，即μ1=μ2=…=μk ； H1：至少有两组总体均数不相等
四、变异分解
2 SS总 xij x xij i 1 j 1 i 1 j 1 k ni

2
k
ni
( xij ) 2
i 1 j 1
k
ni
N
N 1S 2
分布作统计推断。
二、方差分析资料形式
k个处理组的试验结果处理组 1水平 x11 x12 测量值 … x1j … … n1 统计量
x1 x2
…
xk
S1
2水平 …
k水平
x21 …
xk1
x22 …
xk2
… …
…
x2j …
xkj
… …
…
… …
…
n2 …
nk
S2 …
Sk
三、完全随机设计及假设
完全随机设计也称成组设计，只有一个研究因素。如：在实验研究中，按完全随机化原则将受试对象随机分配到多个组（称水平）中去，然后观察实验效应。在调查研究中，按随机化原则，抽取不同组（水平）的某个研究因素，比较该因素的效应。无论是实验，还是调查，研究的目的都是比较不同水平下，各组平均值之间的差别是否有统计学意义。
方差分析应用条件（详见第六节）
1.各样本须是相互独立的随机样本 2.各样本均来自正态总体 3.相互比较的各样本所来自的总体方差相等（方差齐性）
方差分析应用范围
1. 多个样本均数（含两个）间的比较 2.分析两个或多个因素间的交互作用 3.回归方程的假设检验 4.方差齐性检验
方差分析实验（调查）设计类型
1.完全随机设计资料的ANOVA 2.配伍组设计资料的ANOVA
3. 交叉设计资料的ANOVA
4.拉丁方设计资料的ANOVA（三因素试验设计） 5.析因试验设计资料的ANOVA（完全交叉分组设计） 6.正交试验设计资料的ANOVA 7.裂区试验设计资料的ANOVA（多个配伍组与拉丁方试验组合） 8.可重复测量资料的ANOVA
统计学：方差分析
( analysis of variation —ANOVA )
要求： 1.理解ANOVA基本思想 2.熟练掌握成组设计ANOVA的适用条件和计算过程 3.了解配伍设计、析因设计、重复测量资料的ANOVA 4.了解ANOVA的SAS程序和SPSS上机操作过程
引例
例9-1 某医生研究一种降糖新药，按完全随机设计将患者分为三组进行双盲试验。结果如下，试问三组病人的降糖水平是否一致？表9-1 三组病人血糖下降值高剂量组 5.6 9.5 低剂量组 -0.6 5.7 对照组 12.4 0.9 合计
Xij
6.0
… 9.2
12.8
… 3.1 19 5.8000 18.1867
7.0
… 6.0 20 5.4300 12.3843 60 6.8650 18.4176
ni 均数方差
21 9.1952 17.3605
方差分析
方差分析（ analysis of variance ) , 简称ANOVA ，由英国统计学家
k ni ni xij ( xij ) 2 k k 2 j 1 i 1 j 1 SS组间 ni x i x ni N i 1 i 1
对同一试验的多个处理进行比较时，应该有一个统一的试验误差的估计
值。若用t检验法作两两比较，由于每次比较需计算一个 S x1 x2 ，故使得各次比较误差的估计不统一，同时没有充分利用资料所提供的信息而使误差估
计的精确性降低，从而降低检验（推断正确）的灵敏性。如上例试验有10个
处理（因素），每个处理重复20次，共有200个观测值。进行t检验时，每次只能利用两个处理共40个观测值估计试验误差，误差自由度为2(20-1)=38；若利用整个试验的200个观测值估计试验误差，显然估计的精确性高，且误差自由度为10(20-1)=190。可见，在用t检法进行检验时，由于估计误差的精确性低，误差自由度小，使检验的灵敏性降低。
R.A.Fisher首先提出。考虑到样本均数间的差异，可能由于两种原因所致，首先可能由于随机误差所致，随机误差中包括两种成分：个体间的变异和测量误差两部分；其次可能是由于各组所接受的处理不同，引起不同的作用和效果，导致各处理组之间均数不同。一般来讲，各个体之间各不相同，是繁杂的生物界的特点；测量误差是不可避免的，因此第一种原因肯定存

e商务文档

统计学：方差分析

相关文档推荐：