方差分析介绍及案例分析
F= MS组间 /MS组内
? 则F值在理论上应等于1,但由于抽样误 差的影响,F通常接近1,而并不正好等 于1。相反,若三种疗法效果不同,则 组间变异就会增大,F值则明显大于1, 要大到什么程度才有统计学意义呢?可 通过查附表4 方差分析用F界值表得到P
值,将其与事先规定的? 值比较后作出
判断。
单因素多个样本均数的比较 (analysis of one way variance)
? 处理因素只有一个
属于完全随机设计:随机抽样 随机分组 随机试验
C ? ?? X?2 N
SS总 ? ? X 2 ? C
? ? ? SS组间 ?
ni ?
Xi
?
2
X?
?
?
Xi ? 2 ? C ni
SS组内 ? ? si2 ?ni ?1?? SS总 ? SS组间
基本步骤
? 建立检验假设 ? 计算检验统计量(列方差分析表) ? 计算 P 值 ? 下结论
方差分析
? 方差分析(Analysis of Variance, ANOVA) ? 1928年由英国统计学家R.A. Fisher 首先
提出,为纪念Fisher ,以F 命名,故方 差分析又称为F 检验。
方差分析的优点
? 不受比较组数的限制,可比较多组均数 ? 可同时分析多个因素的作用 ? 可分析因素间的交互作用
建立假设
? H0 : ? A=?B=?C ,三种治疗方案治疗婴幼儿
贫血的疗效相同, ? H1 :三种治疗方案治疗婴幼儿贫血的疗效
不全相同或全不相同。
? ? =0.05
计算基本数据
? Xi
? Xi2
表6.4 方差分析基础数据
A
B
C
36.80
28.30
18.60
83.56
72.01
28.86
总和 83.70 184.43
计算SS总,SS组间,和SS组内
? C =(83.70) 2 /60=116.7615
? SS总=184.43-116.76=67.6685
SS组间 ?
36.802
?
28.302 20
? 18.602
? 116.7615?
8.2930
? SS组内=0.91332×19+1.29712×19+
?
0.7
对比组 A与B
(1)
1与3 1与2 2与3
表 6.6 三个样本均数两两比较的 q 检验
列方差分析表
变异来源
表 6.5 单因素方差分析表
SS
?
MS
F
总
67.6685
59
组间
8.2930
2
4.1465
3.98
组内(误差) 59.3755
57
1.0417
P 0.0241
界定P值,作结论
? 总自由度为N-1=60-1=59 ? 组间自由度=组数(k)-1=3-1=2 ? 组内自由度=总自由度-组间自由度
? ? q ? X A ? X B
MS误差 2
?
????
1 nA
?
1 nB
????
? H0:? A = ? B ,每次对比时两个总体均数相等; ? H1:? A≠?B ,每次对比时两个总体均数不等。 ? ? =0.05。
? 将三个样本均数按从大到小顺序排列并编上组次:
组次
1
23
均数
1.840 1.415 0.930
方差分析的应用条件
? 独立性:各样本是相互独立随机的样本 ? 正态性:各样本都来自正态总体 ? 方差齐性:各样本的总体方差相等
看一个实例
? 例6.6 某地用A、B和C三种方案治疗血红蛋 白含量不满 10g 的婴幼儿贫血患者,治疗一 月后,记录下每名受试者血红蛋白的上升克 数,资料见表 6.3,问三种治疗方案对婴幼儿 贫血的疗效是否相同 ?
1.415 1.297 31.9669
C组
2.1 -0.7
1.9 1.3
1.7 1.1
0.2 0.2
2.0 0.7
1.5 0.9
0.9 0.8
1.1 -0.3
-0.2 0.7
1.3 1.4
所有数据
0.930
1.395
0.78
1.071
11.5626 67.6685
59.3755
变异分解
? 总变异
组间变异 组内变异
? 多个样本均数的两两比较不宜用t检验 ? 如用 t 检验,则第一类错误率将增大,
此时易将无差别的两均数错判为有差别
? ? ' =1-(1-? )m ( m=Ck2=k(k-1)/2)
? 如:三个组的比较 1-(1-0.05)3=0.14,比0.05大多了。
多个样本均数间的两两比较
? 用q检验(又称Student-Newman-Keuls 法,即SNK法),统计量为q:
婴幼儿贫血治疗后血红蛋白的增加量(g)
A组 1.8 1.4 0.5 1.2 2.3 2.3 3.7 0.7 2.4 0.5 2.0 1.4 1.5 1.7 2.7 3.0 1.1 3.2 0.9 2.5
均数 标准差 SS
1.840 0.913 15.8482
B组 5.0 2.0 0.2 0.0 0.5 1.6 0.3 3.0 1.9 1.6 1.0 0.0 2.4 3.0 -0.4 0.7 2.0 1.2 1.6 0.7
? SS总=SS组间+SS组内
? ?总=?组间+?组内
总变异——SS总(离均差平方和 )
? ? SS总 ? ? ? Xij ? X 2
?总=N-1
组间变异——SS组间
? ? ? SS组间 ? ni Xi ? X 2
?组间=k-1
MS组间 =SS组间/(k-1)
组内变异——SS组内
? ? SS组内 ? ? ? Xi j? X i 2
? 组内=N -k
MS组内=SS组内/(N-k)
方差分析的基本思想
? 抽样误差 ? 本质上的差别 +
(组间差异)
抽样误差 (组内差异)
? 如果三种治疗方案效果相同,也即三组
样本均数来自同一总体(H0:? 1=? 2=? 3),
那么从理论上说组间变异应该等于组内 变异,因为两者均只反映随机误差(包 括个体差异),这时若计算组间均方与 组内均方的比值:
=59-2=57。
? 查方差分析表得F0.05(2,57)=3.15,F> F0.05(2,57),则P<0.05。
? 故按? =0.05的水准,拒绝H0,接受H1,
故可认为三种治疗方案的治疗效果不一 样。
多个样本均数的两两比较
在方差分析认为多组均数间差异有统计 学意义的基础上,若需了解究竟哪些组 均数之间有差别,还是各组间均有差别, 可用多个样本均数的两两比较(又称多 重比较 multiple comparison)。