统计学--第八章方差分析
处理因素:不同的药物
水平:0.5ml65%乙醇,
0.2g生药/0.5ml65%乙醇
问题的提出
一种新的降血脂药, 120 人分为安慰剂组,用 药 组 1(2.4g) , 用 药 组 2(4.8g) , 用 药 组 3(7.2g)。实验结束后观察血脂水平。
安慰剂组
X =3.43mmol/l
用药组1
排序号(组次):
四、多个样本均数间的多重比较
1)建立假设,确定检验水准 H0: μA=μB H1: μA≠μB α=0.05 2)计算统计量q值。 由于各组的例数都一样,均为8例,而且在进行方差 分析时,已知MS组内=0.175,任意两个比较组的 标准误均为:
s x A x B MS 组内 1 1 ( ) 0.1479 2 n A nB
第八章 方差分析
Analysis of Variance
重点掌握
方差分析的基本思想
完全随机设计、随机区组设计方差分 析和多重比较结果的合理解释
总体
同质、个体变异
随机 抽样
样本 代表性、抽样误差
总体参数 未知
样本统计量已知
统计 推断
风 险
假设检验的原理和步骤
“小概率反证法”思想 如果对总体的H0是真实的,那么不利于或不能支 持这一假设的事件A(小概率事件)在一次试验 中几乎不可能发生的;要是在一次试验中A竟然 发生了,就有理由怀疑该假设的真实性,拒绝H0
二、完全随机设计方差分析步骤
1、 建立检验假设和确定检验水准 H0: 1 2 3 ( 四组血清IL-2水平总体均
4
数相等)
H1:四组血清IL-2水平总体均数不等或不全相等 α=0.05 2、计算F值
直接计算(软件) 或间接估计(查表)
3、确定P值和作出推断结论
二、完全随机设计方差分析步骤
s x A x B 1 1 2 MS组内 ( ) 0.172 0.2092 nA nB 8
四、多个样本均数间的多重比较
3)确定P值,做出推断结论 v=N-K=32-4=28,查t界值表,得:
比较组
| XA XB |
t值
P < 0.001
甲与乙 0.7287 3.4849 0.001< P <0.002 甲与丙 1.8575 8.8833
3、使用近似F检验
t检验也类似!!!
方差分析的基本思想
例 在大肠湿热征模型研究中,将32只大鼠 随机分成4组,每组8值,分别为正常对照 组(甲组)、大肠杆菌模型组(乙组)、轮 状病毒模型组(丙组)和大肠杆菌加轮状病 毒混合模型组(丁组)。测得大鼠血清白细 胞介素IL-2水平见下表。试比较不同大鼠 模型的血清IL-2水平是否有差别。
处 理 因 素
水平1 水平2
水平k
方差分析的应用条件
应用条件 1、各个样本是相互独立的随机样本; 2、各个样本来自正态总体; 3、各个处理组的总体方差相等,即方差齐。
t检验的应用条件??
方差分析的应用条件
不满足应用条件时处理方法
1、进行变量变换,以达到方差齐或 正态的要求 2、采用非参数法(秩和检验)
甲与丁 1.9737 9.4390
乙与丙 1.1288 5.3984 乙与丁 1.2450 5.9541 丙与丁 0.1162 0.5557
方差
SS/(n-1)
消除n 的 影响
总变异
所有观察值几乎不同,各观察值与 总体均数间的差异为总变异
SS总 ( xij x)
i j
第i个处理 水平 每个水平 组的第j例
2
v总 =n 1
总均数
任一 观测值
组内变异 同一水平处理组,各观测值不完全相等
组内变异
同组内的血清IL-2水平不一致 原因是不同个体的随机误差
第i个处理 水平 每个水平 组的例数 第i组的 均数
2
总均数
方差分析的基本思想
SS总=SS组内+SS组间
随机误差
组内变异
SS组内
SS总
总变异
随机误差+处理的作用(可能 存在)
组间变异
SS组间
方差分析表
变异来源 组间 组内 总 SS SS组间 SS组内 SS总 v k-1 N-k N-1
组间方差,又 称组间均方 (MS组间)
四、多个样本均数间的多重比较
例
在方差分析的基础上,对不同大鼠模型的 IL-2水平进行SNK法的多重比较。 先将样本均数从小到大排序,对比组次从1-4
均数排序(从小到大) 处理组(原组号) 均 例 数: 数: 甲 0.2913 8 1 乙 1.0200 8 2 3 丙 2.1488 8 丁 2.2650 8 4
SNK q检验
LSD -t检验
四、多个样本均数间的多重比较
(一)SNK-q检验
可对所有对照组及处理组的样本均数进行
两两比较
适用于探索性研究,在研究设计阶段未预
先考虑或未预料到,经数据结果的提示后
才决定的多个均数间每两个的事后比较
四、多个样本均数间的多重比较
计算公式
| XA XB | q S -0.05)k=0.4013
问题的提出
t检验的局限性
比较两组样本均数
(单因素两水平)
方差分析
方差分析(Analysis of Variance,简写为
ANOVA )
由英国统计学家R.A.Fisher在1918年提出
F检验
方差分析的原理
单因素方差分析/完全随机设计方差分析 (one-way ANOVA):研究一个处理因素 (有k个水平),将n个观察单位随机分配到k 个水平,观察水平间效应的差别
变异来源 组间 组内 总
SS 21.429 v 3 MS 7.143 F P
40.766 4.906 26.335 28 31 0.175
<0.01
二、完全随机设计方差分析步骤
结论:
按α=0.05的水准,拒绝H0,接受H1,四
组均数之间的差异有统计学意义,可认
为四个模型组IL-2平均水平总体有差别。
| XA XB | t SX AXB
SX AXB
组内=N-k
1 1 MS组内 ( ) n A nB
自由度=υ
四、多个样本均数间的多重比较
LSD法实际上是一种t检验法,主要区别在
于计算标准误中的合并方差及自由度的不
同
仍按算得的t值查附表2,t界值表,作出 推断结论
四、多个样本均数间的多重比较
二、完全随机设计方差分析步骤
注意!
1. 如果方差分析有差别,只能说明总体间 有差别,各组中哪两组间是否有差别, 还要进一步做多重比较 2.如果方差分析无差别,分析结束
四、多个样本均数间的多重比较
多重比较(Multiple Comparison),又称两两 比较 假如每次t检验犯第一类错误的概率是0.05,那 么要完全地进行比较,犯第一类错误的概率是 1-(1-a)k。
四、多个样本均数间的多重比较
3)确定p值做出推断结论
比较组
1与4 1与3 1与2 2与4 2与3 3与4
XA XB
a
4 3 2 3 2 2
q值
13.345 12.559 4.927 8.418 7.632 0.786
q0.05(a,28)
3.87 3.51 2.90 3.51 2.90 2.90
(1)建立假设和确定显著性水平
(2)计算检验统计量 (3)确定P值和做出推断
可能发生的两类错误
检验结果 真实情况
拒绝H0
不拒绝H0
H0 成立
H1成立
I型错误(a )
推断正确(1-a )
II 型错误 ( b ) 推断正确(1-b)
问题的提出
t检验实例
外用中药搽剂骨肌康对小鼠琼脂肉芽的抑制作用。 给予对照组0.5ml65%乙醇,试验组施用大剂量骨肌 康,给予0.2g生药/0.5ml65%乙醇,观察两组的肉芽 肿重。
SS 组内 (xij x i )
i j
2
第i个处理 水平
每个水平 组的第j例
任一 观测值
第i个处 理组的均 数
组间变异 各水平处理组的均值不同
组间变异
不同组间的血清IL-2水平不同
原因:处理因素的效应(如果存在的话);随机误
差组间变异
SS组间 ni ( xi x)
的比较,多个组与一个特定组间的比较或者特
定组间的比较(Planned Multiple
Comparison) 方差分析得到有差别的结论后多个组之间的 相互比较的探索性研究(Post Hoc)
四、多个样本均数间的多重比较
两两比较方法
多个样本均数间每 两个均数的比较 多个实验组分别与对照组 均数间的两两比较
一、方差分析的基本思想
SS总=SS组间+SS组内
组内变异(SS组内):随机误差 组间变异(SS组间) :处理因素+随机误差 当H0 为真时,由于处理因素不起作用,组间 变异只受随机误差的影响。此时,组间变异 与组内变异相差不能太大,有 MS组间 SS组间 k 1 1 MS组内 SS组内 n k
i列, i =1,2..k,在此 k=4,处理组数
总例数
j 行, j =1,2…,ni,
在此j=8
总例数
第 i个 处理 组的 样本 均数
总 均 数
总变异 所有个体的血清IL-2水平几乎都不同
回顾:正态分布资料的离散趋势指标
SS (X X )
离均差 平方和
2
变异度
总例数n(自由度n-1)
1 0.95 0.2649