统计学:方差分析
x
S
4.29
5.44
3.93
6.55
4.83
4.86
3.88
3.89
5.38
4.08
2 两两比较的t检验的比较次数为:m C10 45 次
若 0.05, 45次中恰有5次有统计学意义的结果
比较组 1 与3 1与6 1与7 1与9 1与10
t
P
2.601
0.013
2.329
0.025
2.372
0.023
2.272
0.029
2.918
0.006
实际上犯第一类错误的概率为5/45≈0.11>0.05。 理论上,4ቤተ መጻሕፍቲ ባይዱ次同时不犯第一类错误的概率为(1﹣0.05)45 = 0.09944,而犯第一类错误的概率为 1﹣ (1﹣0.05)45 =
0.90055
t 检验两两比较的精确性和检验的灵敏性低
第一节 完全随机设计资料的ANOVA 一、 方差分析的基本思想
方差分析的基本思想是将所有观察值之间的变异(称为总变异)按设计和需要分解成
几部分。如:
完全随机设计资料的ANOVA,将总变异分解为组间变异和组内变异两部分,后者称 为误差:
总变异 = 本质上的差别 (组间差异)
+
抽样误差 (组内差异)
由于ANOVA是根据试验设计将总变异分成若干部分,因此设计时考虑的因素越多, 变异划分的越精细,各部分变异的涵义越清晰明确,结论的解释也越容易。同时由于变异 划分精细,误差部分减小,提高了检验的灵敏度和结论的准确性。 方差分析的基本思想是:按造成数据变异的来源分解离均差平方和与自由度,然后借助F
在。而第二种原因是否存在,这正是假设检验要回答的问题。
多组资料均数比较不宜用两样本t 检验进行两两比较,否则会增大犯第
一类错误的概率。
计算机模拟两两比较的第一类错误
表9-2
样本号 1 12.61 2 10.85
从已知总体N(10,52)随机抽取10个样本(ni=20)的结果
3 9.23 4 9.11 5 10.90 6 9.24 7 9.55 8 10.28 9 9.12 10 8.75
ANOVA的假设: H0:k 组总体均数相等,即μ1=μ2=…=μk ; H1:至少有两组总体均数不相等
四、变异分解
2 SS总 xij x xij i 1 j 1 i 1 j 1 k ni
2
k
ni
( xij ) 2
i 1 j 1
k
ni
N
N 1S 2
分布作统计推断。
二、 方差分析资料形式
k个处理组的试验结果 处理组 1水平 x11 x12 测量值 … x1j … … n1 统计量
x1 x2
…
xk
S1
2水平 …
k水平
x21 …
xk1
x22 …
xk2
… …
…
x2j …
xkj
… …
…
… …
…
n2 …
nk
S2 …
Sk
三、 完全随机设计及假设
完全随机设计也称成组设计,只有一个研究因素。如: 在实验研究中,按完全随机化原则将受试对象随机分配到多个组(称水平)中 去,然后观察实验效应。 在调查研究中,按随机化原则,抽取不同组(水平)的某个研究因素,比较该 因素的效应。 无论是实验,还是调查,研究的目的都是比较不同水平下,各组平均值之间的 差别是否有统计学意义。
方差分析应用条件(详见第六节)
1.各样本须是相互独立的随机样本 2.各样本均来自正态总体 3.相互比较的各样本所来自的总体方差相等(方差齐性)
方差分析应用范围
1. 多个样本均数(含两个)间的比较 2.分析两个或多个因素间的交互作用 3.回归方程的假设检验 4.方差齐性检验
方差分析实验(调查)设计类型
1.完全随机设计资料的ANOVA 2.配伍组设计资料的ANOVA
3. 交叉设计资料的ANOVA
4.拉丁方设计资料的ANOVA(三因素试验设计) 5.析因试验设计资料的ANOVA(完全交叉分组设计) 6.正交试验设计资料的ANOVA 7.裂区试验设计资料的ANOVA(多个配伍组与拉丁方试验组合) 8.可重复测量资料的ANOVA
统计学:方差分析
( analysis of variation —ANOVA )
要求: 1.理解ANOVA基本思想 2.熟练掌握成组设计ANOVA的适用条件和计算过程 3.了解配伍设计、析因设计、重复测量资料的ANOVA 4.了解ANOVA的SAS程序和SPSS上机操作过程
引例
例9-1 某医生研究一种降糖新药,按完全随机设计将患者分为三组进行双盲试 验。结果如下,试问三组病人的降糖水平是否一致? 表9-1 三组病人血糖下降值 高剂量组 5.6 9.5 低剂量组 -0.6 5.7 对照组 12.4 0.9 合计
Xij
6.0
… 9.2
12.8
… 3.1 19 5.8000 18.1867
7.0
… 6.0 20 5.4300 12.3843 60 6.8650 18.4176
ni 均数 方差
21 9.1952 17.3605
方差分析
方差分析 ( analysis of variance ) , 简称ANOVA ,由英国统计学家
k ni ni xij ( xij ) 2 k k 2 j 1 i 1 j 1 SS组间 ni x i x ni N i 1 i 1
对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计
值。若用t检验法作两两比较,由于每次比较需计算一个 S x1 x2 ,故使得各 次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估
计的精确性降低,从而降低检验(推断正确)的灵敏性。如上例试验有10个
处理(因素),每个处理重复20次,共有200个观测值。进行t检验时,每次 只能利用两个处理共40个观测值估计试验误差,误差自由度为2(20-1)=38; 若利用整个试验的200个观测值估计试验误差,显然估计的精确性高,且误 差自由度为10(20-1)=190。可见,在用t检法进行检验时,由于估计误差的精 确性低,误差自由度小,使检验的灵敏性降低。
R.A.Fisher首先提出。考虑到样本均数间的差异,可能由于两种原因所致, 首先可能由于随机误差所致,随机误差中包括两种成分:个体间的变异和 测量误差两部分;其次可能是由于各组所接受的处理不同,引起不同的作 用和效果,导致各处理组之间均数不同。一般来讲,各个体之间各不相同, 是繁杂的生物界的特点;测量误差是不可避免的,因此第一种原因肯定存