当前位置:
文档之家› 临床科研中常用的统计分析方法
临床科研中常用的统计分析方法
如果P值大于α,说明协方差阵的球对称性质得 到满足。否则,必须对与时间有关的F统计量 的分子和分母自由度进行调整,减少Ⅰ类错误 的概率。调整系数为:ε(读:epsilon)
3.自由度常用调整方法
①Greenhouse-Geisser 法,简称:GG法 ②Huynh-Feldt 法,简称:H-F法 ③Lower-bound法,简称:L-B下界法 以上前两种方法较复杂,采用软件计算。
重复测量设计的方差分析
重复测量设计
一、重复测量资料的数据特征 当对同一受试对象在不同时间重复测量次数p≥3时,称为重 复测量设计或重复测量数据。
测量时间点 受试者 1 2 : n y11 y21 yn1 1 y12 y22 yn2 2 … … … … y1p y2p y np p
图例
重复测量资料
首先要求样本是随机的, 除了满足一般方差分析 条件外,特别强调满足 协方差阵(covariance
matrix)球形性。
sphericity
S 2 S 2 S 2 1a 11 12 2 2 S 21 S 22 S 22a V 2 2 2 S a1 S a 2 S aa
的自由度需要调整。
常用的调整方法
4. 计算F值
时间点间
误差
球对称性通常采用 MAUCHLY’S TEST检验来判断
其结果按α=0.1水准检验,不满足球对称性, 对系数ε进行校正,其结果如下:
结果显示:治疗前与治疗后不同时间转氨酶平均水平不同。
5.单组重复测量方 差分析数据结构
4. 举例:单组重复测量数据的方差分析
观察10名慢性乙型肝炎患者治疗前、治疗12周、24周、 36周四个时间点上谷丙转氨酶(ALT)水平的变化趋 势,结果见下表,试进行统计推断。
分析: 数据结构上与完全区组设计相似
但实质不同
各观测点时间顺序是固定的,不能随机分配;不同观测
点数据彼此不独立或不完全独立,存在一定的相关性。
SAS结果中包括偏相关阵
例题 1.建立假设,确定检验水准Α=0.01
2.进行球对称性检验
球对称性通常采用 Mauchly’s test检验标准来判断
3.调整时间点F值的自由度 调整原则:
⑴当资料满足“球对称”(Sphericity)条件时( P>α) ,不 作调整。
⑵当资料不满足“球对称” 条件时( P<α) ,时间点间F值
协方差举例
1、平方和 2、回归关系的显著性检验
变异来源 回归 误差
自由度 平方和 均方 F值 1 1010.76 1010.76 88.8** 227.615 11.38 20
协方差举例
3、纠正后的处理间方差分析
变异来源 处理 误差 总变异 自由度 平方和 均方 F值 2 707.218 353.609 31.07** 227.615 11.381 20 22 934.833
●流行病学研究中,观察队列人群在不同时间上的发
病情况。研究不同职业、性别人群实施某种控制后,
不同时间的多次效果考察。
●卫生学研究中,纵向观察儿童生长发育规律等,不 同地区和环境营养状况。
提醒大家
重复测量数据在医学研究中十分常见,在 医学类杂志上约占四分之一,而且统计
表达和分析误用情况严重。
主要优点
水平 观察值
x 15 13 11 12 12 16 14 17 y 85 83 65 76 80 91 84 90
x 17 16 18 18 21 22 19 18 y 97 90 100 95 103 106 99 94
A1
A2
A3
x 22 24 20 23 25 27 30 32 y 89 91 83 95 100 102 105 110
等级定性反应变量
卡方、Ridit、秩和检验、CMH
2.1 差异性检验——(4)
定量数据 统计描述
例数、均数、标准差、中位数、四分位数间距、最大值、最小值 t检验 ANOVA GLM(协方差)
统计推论
生存时间 N年生存率、中位生存期、无病进展时间等 Life table K-M test COX
完全随机设计 配对设计 随机区组设计 交叉设计 序贯设计 重复测量设计 ……
5 统计方法的应用/使用条件
对样本量的要求 对应变量、自变量分布类型的要求 对数据缺失程度的要求
二、常用的统计分析方法
差异性检验 疗效性检验
优效性 等效性 非劣效性
2.1 差异性检验——(1)
减少样本含量 控制个体变异 非实验因素(干扰因素)
1. 单组重复测量 指同一组内(或接受同一种处理)的多个受试者,在多个时 间点上的反应变量所作的测量,又称为单变量重复测量。
● 单变量重复测量方差分析
受试者
1 2 : n y11 y21 yn1
测量时间点
1
2
y12 y22 yn2
…
… … …
p
y1p y2p y np
ˉ 4、用回归纠正每处理的平均增重 yi= μi+b(xi-x)
注意的问题
1、统计资料应服从正态分布,否则要做适当的统计代换。 2、做一般方差分析时处理间差异显著,而做协方差分析时, 处理间差异反而不显著,说明所谓的差异是由于初始的试验 条件造成的,并非处理间真正的差异。 3、做一般方差分析时处理间差异不显著,而做协方差分析时, 处理间差异反而显著,说明除去试验条件的影响后处理间有 真正的差异间估计
3. 中医领域的应用
方差分析——一类方法
完全随机设计 随机区组设计 交叉设计 拉丁方设计 析因设计 正交设计 均匀设计 嵌套设计 重复测量设计 裂区设计 协方差分析 多元方差分析 重复测量的方差分析
协方差分析
临床科研中常用的统计分析方法
邢建民 北京中医药大学循证医学中心 2013-5-18
主要内容
一.
如何正确抉择统计方法
二.
常用的统计方法
中医领域的应用
三.
一、如何正确抉择统计方法
1 分析集
2 研究目的
3 资料类型 4 设计类型 5方法的应用/适用条件
1 分析集(ANALYSIS SET)
0
概念:
0S
2 a2
S12a 2 S2a 2 S aa
协方差阵的球对称性是指该对角线元素(方差)
相等、非主对角线元素(协方差)为零
若球对称性得不到满足,方差分析的F值是有偏的, 会增大Ⅰ类错误的概率
2. 用Mauchly法检验协方差阵的球形性质
•协方差分析的概念 •协方差分析模型 •协方差分析举例
一、协方差分析的概念
试验设计的三项基本原则,目的就是为了排除非处理因素 的干扰和影响,使试验误差的估计降到最低限度,从而可以 准确地获得处理因素的试验效应。 但在某些实际问题中,有些因素在目前还不能控制或难以 控制,如在动物饲养试验中,动物增加的平均体重不仅仅与 动物的进食量有关,甚至与各动物的初始重量等因素有关系。 如果直接进行方差分析,会因为混杂因素的影响而无法得出 正确结论。
3 资料类型
资料类型包括三个方面
数据性质
定量资料 定性资料
资料分布类型
正态分布 偏态分布 分布类型不清
结局变量的类型
数值变量 分类变量 二分类 无序多分类 有序分类
4 设计类型
统计设计的类型取决于研究目的,实际上是为了更 好地达到研究目的而采取的设计方案 从统计学上来讲,临床上常用的有:
临床试验中的3种数据来源
处理 反应 影响因素
2.1 差异性检验——(2)
基线测定数据的可比性:
20个指标中有4个有统计学意义,则随机有问题 (P=0.0159)
2.1 差异性检验——(3)
定性数据
统计描述
统计描述
频数和百分比
统计推论
两个率的比较
卡方检验、Fisher;logistic回归
分析集应在研究设计阶段确定,建立规则。 意向性分析集(intention to treat, ITT) 全分析集(Full analysis set,FAS) 符合方案集(per protocol set,PPS) 安全集(safety set,SS)
使用适宜、正确的统计分析方法是统计结论真实可靠的重 要保证。 统计分析包括:
协方差分析的功用就是用处理前的基数矫正处理后的结果,
提高其精确度。
二、协方差分析模型
考察某因素对因变量Y的影响,布置了一单项分类资料的试 验,其方差分析模型为: yij=μi+εij μi该因素第i个水平的效应,εij为随机误差 同时收集到与y有密切回归关系的变量x,其方差分析模型变 为: yij= μi+b(xij-x)+dij b为y对x的回归系数,dij为随机误差
2.多组重复测量(多组并不等于多因素)
指将受试者按处理的不同水平分为几个组,对这些组内的每一受 试者,都在不同时间点对他们的反应变量进行测量。
表3.1(余松林)
● 单变量重复测量方差分析 1. 单组重复测量数据方差分析 2. 两组重复测量数据方差分析
二、重复测量资料分析的前提条件和基本步骤
1.前提条件:
平行性假定: •各组协变量和因变量的关系是线性的 •各组残差正态 ˉ •各组回归斜率相等,即各组回归线是平行的