医学统计学(方差分析)
19名要求持续镇痛的病人被随机分到四组,接受同剂量的吗 啡,6小时后测量血中游离吗啡水平,问四组之间有无差别?
静脉点滴 肌肉注射 皮下注射
口服
12
12
9
12
已知多组样本的信息 10
16
7
8
推断多个总体的信息 7
15
6
8
(均数)
8
9
11
10
9
7
14
均数
10
13
8
9.5
总体-样本? 用什么检验方法?
问题:1、分析问题,选择合适的统计方法 2、如何整理资料、输入计算机
.
.
列举存在的变异及意义
全部的30个实验数据之间大小不等,存在变异, 总变异。
各个组间存在变异:反映处理因素之间的作用, 以及随机误差。
各个组内个体间数据不同:反映了观察值的随 机误差。
各种变异的表示方法
.
各种变异的表示方法
单因素方差分析
.
结合上题理解:方差分析的基本思想
将全部观察值总的离均差平方和( SS总)及自
由度( 总)分解为两个或多个部分
除随机误差外,其余每个部分的变异可由某个 因素的作用加以解释
通过比较不同来源变异的均方(MS),借助F 分布做出统计推断,从而了解该因素对观察指 标有无影响。
.
存在问题
.
SS组内=SS总-SS组间=7881.87-2384.026=5497.84 Ν总=N-1=29, Ν组间=k-1=2, Ν组内=N-k=30-3=27 MS组间=SS组间/ν组间 =1192.01 MS组内=SSE/ν组内 =203.62 F=MS组间/MS组内=5.8540
.
(3)查方差分析F界值表8确定P值: F 0.05(2,30) =3.32 ; F 0.01(2,30) =5.39
.
三、优点
① 不受比较的组数限制。 ② 可同时分析多个因素的作用。 ③ 可分析因素间的交互作用。
四、方差分析的应用条件
① 各样本是相互独立的随机样本 ② 各样本来自正态总体 ③ 各组总体方差相等,即方差齐
.
【例题1】
某社区随机抽取糖尿病患者、IGT异常和正 常人共30人进行载脂蛋白测定,结果如下, 问3种人的载脂蛋白有无差别?
(1-0.05)3=0.857
.
四均数比较作6次 (1-0.05)6=0.735 五均数比较作10次 (1-0.05)10=0.599 六均数比较作15次 (1-0.05)15=0.463 鉴于以上的原因,对多组均数的比较问题
我们采用方差分析
.
二、单因素方差分析的基本思想
例1 某克山病区测得11例克山病患者与13名健康 人的血磷值(mmol/L)如下,问该地急性克 山病患者与健康人的血磷值是否不同?
(1) 建立假设,确定检验水准
H0: 任2个人群的载脂蛋白的总体均数相等,即μA=μB H1: μA≠μB , =0.05。 (2) 样本均数排序
将3组样本均数从小到大(或从大到小)顺序排列,编上 组次,并注上组别.
组次
1
2
3
均数 102.39
105.45
122.80
组别 IGT异常 糖尿病患者 正常人
4个样本均数间的比较
.
多重比较方法(两两比较)
对满足正态性和方差齐性的资料: ①多个实验组分别 与一个对照组比较常用Dunnet-t法。 ②每两个均数比较 常用最小显著差值法(LSD-t)、SNK(StudentNewman-Keuls,即q检验)法、Tukey(可靠显著差异) 法、Bonferroni-t(校正最小显著差异)调整法等。
方差分析结果提供了各组均数间差别的总的信 息,但尚未提供各组间差别的具体信息,即尚 未指出哪几个组均数间的差别具有或不具有统 计学意义。
为了得到这方面的信息,可进行多个样本间的 两两比较。
.
第二节 多个样本均数间的两两比较 (又称多重比较)
多重比较即多个样本均数间的两两比较,由 于涉及的对比组数大于2,若仍用t 检验作每两个 对比组比较的结论,会使犯第一类错误的概率α 增大,即可能把本来无差别的两个总体均数判为 有差别。
.
FM M组 S组 S 间 内 =11
H0成立时 H1成立时
如果两组样本来自同一总体,即克山病患者与 健康人血磷值相同,则理论上F应等于1,因为 两种变异都只反映随机误差。由于抽样误差的 影响,F值未必是1,但应在1附近。若F较小, 我们断定2组均数相同,或者说来自同一总体, F较大,推断差分析的几个概念和符号
什么是方差? 离均差 离均差之和 离均差平方和(SS) 方差(2 S2 )也叫均方(MS) 标准差:S 自由度: 关系: MS= SS/
.
7
方差分析的几个符号
xij表示第i组第j个观察值
x i.表示第i组的均数(=
1
) xij ni j
9
9
14
均数
10
13
9
12
7
8
6
8
11
10
7
8
9.5
单因素方差分析
.
完整书写方差分析的过程
建立假设:
H0 :4组病人血浆游离吗啡水平1 = 2 = 3= 4
H1 : 4组病人血浆游离吗啡水平的总体均数全不相等或不全 相等
确定显著性水平,用 表示。区分大小概率事件的标准,常取 0.05。
计算统计量F: F=MS组间/MS组内
t
Xi Xj
,(df=dfe) (6-9)
Se2(1/ ni 1/nj )
可查统计附表7确定概率P的大小。
常用于多个样本均数间每两个均数的比较。
.
三、 Dunnett-t检验
实验组 对照组
可查统计附表9确定概率P的大小。 常用于多个实验组与一个对照组均数
间的两两比较。
.
四、Bonferroni-t检验 调整检验水准法
.
(3)列出两两均数比较的q检验计算表
从p值一栏中可以推断出结论,即IGT异常(1)与正常人 (3)的载脂蛋白有差别, 糖尿病患者(2)与正常人(3)的载 脂蛋白有差别。
.
二、LSD- t 检验
由Fisher提出,称为最小显著性差异法。 在H0:μi=μj假设下,t统计量检验μi与μj是否相同。
对不满足正态性和方差齐性的资料:①可通过数据变换, 使满足方差分析的应用条件。②可用非参数检验法,如 秩和检验。③可采用近似检验,如Tamhane's T2, Dunnett's T3,Games-Howell,Dunnett's C等方法。
.
一、q检验(又称Student-Newman-Keuls法,简称
了解:
1、两因素方差分析
.
教学内容提要
重点讲解:
方差分析的基本思想 完全随机设计的单因素方差分析 多个样本均数间的多重比较
介绍:方差分析的原理与条件
.
与前面讲过的假设检验相同的是:
不同的是:方差分析用于多个均数的比较。
t检验是用 t值进行假设检验,方差分析则用 F值进行假设检验
方差分析的任务:统计量F的计算 F=MS1/MS2
患者x1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人x2:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
.
24名患者与健康人的血磷值大小不等,称这种 变异为总变异。可以用总离均差平方和
.
一、方差分析的意义
前一章介绍了两个样本均数比较的假设检 验方法,但对于3个、4个、5个均数或更多个的 比较,t检验或u检验就无能为力了,或许有人会 想起将几个均数两两比较分别得到结论,再将结 论综合,其实这种做法是错误的。试想假设检验 时通常检验水平α取0.05,亦即弃真概率控制在 0.05以内,但将3个均数作两两比较,要作三次 比较,可信度成为
组间 组内
(4) 作出推断结论 按α=0.05水平拒绝H0,接受H1,认为三种人载脂 蛋白的总体均数不同。
.
完整书写方差分析的过程
建立假设,确定显著性水平: H0 :3种载脂蛋白的总体均数相等 1 = 2 = 3 H1 :3种载脂蛋白的总体均数不相等或不全相等 H1与H0相反,如果H0被否决,则H1成立。
SS总=
及N来反映,总自由度 νT=N-1。
.
2个组各组内部血磷值也不等,这种变异称为 组内变异,其大小可用2组组内离均差平方和
k nj
SS组内=
(xij xi )2 =
(ni 1)si2
i1 j1
及各组例数ni来反映,自由度ν组内=N-k(k是 组数),它反映了随机误差。
.
2组样本均数也不等,这种变异称为组间变异, 反映了克山病对血磷值的影响和随机误差
常取0.05,区分大小概率事件的标准。 计算统计量F:根据资料的性质选择不同的统计方
法。注意都是在H0成立的条件下进行计算。 计算概率值P:P的含义。 做出推论:统计学结论和专业结论。
.
四组不同摄入方式人的血浆游离吗啡水平
静脉点滴 肌肉注射 皮下注射 口服
12
12
10
16
7
15
8
问3种不同营养素喂养后所增体重有无差别?
.
.
第三节 随机区组(配伍组)设计的多个样 本均数的比较(双因素方差分析)
方法:应用分层的思想,事先将全部受试对象按某种 或某些特性分为若干个区组,使每个区组内的观察对 象与研究对象的水平尽可能相近
SS总 总 MS总
SS组内 组内 MS组内
三者之间的关系: