回顾性临床研究的设计和分析
2
专业资料,仅供医药卫生专业人士参考
前瞻性 vs.回顾性
• 时间顺序性
– 研究问题 vs. 数据收集 – 暴露因素 vs. 研究结局
• 数据的分析永远是回顾性的 • 数据的产生永远是前瞻性的
3
专业资料,仅供医药卫生专业人士参考
常见的回顾性研究设计
• 一般为观察性研究 • 回顾性队列研究(因 → 果) • 病例对照研究( 果 → 因) • 横断面研究
横断面研究
• 了解某种疾病或状态 在特定时间、某个人 群中的分布状态(流 行率)
流行率=
+
37
专业资料,仅供医药卫生专业人士参考
横断面研究
• 特殊的病例对照研究
– 所有的non-case均选为control – 相关因素分析(OR)
38
专业资料,仅供医药卫生专业人士参考
横断面研究的设计要素
人群的切面
• 确定研究人群
– 在哪个人群切?
• 确定数据收集/产生时间
– 在什么时候切?
• 结局与暴露的专业资料,仅供医药卫生专业人士参考
数据收集/产生时间
• 日历时间(calendar time)
– X年X月-X年X月
• 事件时间(event time)
– 就诊、诊断、治疗、死亡…
40
– 了解可能存在的组间差异
• 回归分析(Regression analysis)
– 偏倚与混杂的校正,分析影响因素
44
描述性分析
• 根据变量类型选择分析方法
变量类型 连续变量
分类变量
描述性分析
• 按连续变量报告 • 平均数(SD, 95% CI) • 中位数(Range, IQR)
• 转换成分类变量,如年龄段 • 计数,百分比
• 较队列研究更难控制 • 可用的方法
– 配对 – 尽可能收集风险因素 – 使用客观测量结果 – 分析:分层、多因素分析
• 承认其存在以及研究的局限性
32
专业资料,仅供医药卫生专业人士参考
• 研究问题:
– MKK4基因多态性与结直肠癌的相关性
• 研究设计:
– 病例对照
33
专业资料,仅供医药卫生专业人士参考
病例对照研究中的 偏倚与混杂
• 选择性偏倚
– 不恰当的选择对照(受暴露状态的影响) – 病例与对照来自不同人群
• 信息偏倚(暴露信息不准确)
– 回顾性的数据收集方式
• 回忆偏倚 • 研究者引入的偏倚
• 混杂
– 风险因素数据不完整或缺失
31
专业资料,仅供医药卫生专业人士参考
病例对照研究中的 偏倚与混杂的控制
• 计数、百分比
45
组间比较
• 比较组间基线特征差异
– t检验(连续变量) – 卡方检验(分类变量)
• “我该使用哪种检验方法?”
/stat/mult_pkg/whatstat/default.htm
46
①
① Dependent Variable: 因变量(年龄)
• 研究实施上
• 减少因失访导致的信息缺失
• 数据分析上 • 结果解读上
• 分层分析 • 多变量分析 • 谨慎,避免结论性的论断
15
专业资料,仅供医药卫生专业人士参考
队列研究的终点/结局
• 事件的发生(已知)
– Time-to-event (OS, PFS) – Disease incidence
• 外部对照
– 不同地点,不同时间 – 需要更强的相似性假设
12
专业资料,仅供医药卫生专业人士参考
暴露组与对照组的可比性
• 观察性研究的特性决定了暴露组与对照组 是不可比的
– 基线的背景风险不同(选择性入组)
– 脱落者与在访者的背景风险不同(选择性脱落)
• 忽略这种不同会影响我们对结果的解读
随机
(Randomization) “选择性偏倚”
– 暴露或者风险发生的起点
– 过去的某个时间点
• 终点:
– 事件发生 – 失访或脱落
过去的某个时间点
– 研究结束
现在 or 过去的某 个时间点
9
专业资料,仅供医药卫生专业人士参考
确定研究人群
• 目标人群 • 源人群 • 研究人群
从研究起点(过去)进行选择
10
专业资料,仅供医药卫生专业人士参考
确定暴露状态
– 减少了样本量,降低研究的效力 – 造成选择性偏倚
• 应对措施
– 补充数据,减少失访造成的信息缺失 – 接受现实、评估可能的影响、谨慎解读结果
19
专业资料,仅供医药卫生专业人士参考
病例对照研究
• 研究结局(果) → 暴露状态(因)
– Step 1: 根据结局确定“病例”与“对照” – Step 2: 确定各自的暴露状态 – Step 3: 计算
• 多因素分析:
– Y=α+β1X1+β2X2+β3X3+…βnXn – 生存状态=α+ β1*治疗方案+β2*年龄+β3*并发疾病 – 校正后估计,考虑其他因素对Y的影响
49
多变量分析中变量的选择
• 统计学方法
– Backward, Forward, Stepwise – AIC, BIC, Adjusted-R2
13
专业资料,仅供医药卫生专业人士参考
举例:死亡率指标
“二、三级综合医院医疗服务能力标准”征求意见稿
住院患者死亡率 住院手术死亡率
三级医院
≤0.8%
≤1.4‰
二级医院
≤0.4%
≤0.28‰
14
专业资料,仅供医药卫生专业人士参考
“差异”的校正和控制
• 研究设计上
• 选择内部对照 • 尽可能收集风险因素
– 如果发生了研究结局,那么对照符合病例的入 选标准
• 对照的选择不受暴露因素的影响 • 除了暴露因素外,对照应与病例类似 • 病例对照比例:1:1~1:4
29
专业资料,仅供医药卫生专业人士参考
判断暴露状态
• 往往是回顾性的
– 基于已有病例档案(完整性?) – 基于回忆(准确性?)
30
专业资料,仅供医药卫生专业人士参考
34
专业资料,仅供医药卫生专业人士参考
暴露因素测量
• 问卷:吸烟、饮酒、家族史…… • 采集血样进行基因分析
Yisheng Wei, et al. Int. J. Cancer: 125, 1876–1883 (2009)
35
专业资料,仅供医药卫生专业人士参考
36
专业资料,仅供医药卫生专业人士参考
20
专业资料,仅供医药卫生专业人士参考
病例对照研究
21
专业资料,仅供医药卫生专业人士参考
病例对照研究
病例
22
专业资料,仅供医药卫生专业人士参考
病例对照研究
病例 对照
23
专业资料,仅供医药卫生专业人士参考
结局
病例: 对照:
暴露
24
专业资料,仅供医药卫生专业人士参考
Odds Ratio (OR)
“信息偏倚”
17
专业资料,仅供医药卫生专业人士参考
回顾性队列研究中的 选择性偏移与信息偏移
• 选择性偏移
– 选择性入组和脱落 – 回顾性数据的完整性
• 信息偏移
– 回顾性数据的准确性 – 回忆的准确性 – 暴露状态对结局的影响相对较小
18
专业资料,仅供医药卫生专业人士参考
关于失访
• 观察性研究的失访无法避免 • 对临床研究的影响
• 随访终点(已知)
• 一个队列研究可观察多个研究结局
16
专业资料,仅供医药卫生专业人士参考
结局和暴露状态的测量
• 基本原则:独立与客观
盲法 (Blinding)
– 研究结局不应影响暴露状态的判断
– 暴露状态不应影响研究结局的判断
• 观察性研究中不存在完全的独立与客观
• 测量的误差会影响研究结果,无法校正
病例 对照
暴露
4
病例
2
对照
非暴露
2
4
OR=
25
专业资料,仅供医药卫生专业人士参考
病例对照研究 可以回答哪些问题?
• 疾病或状态的影响因素(比较性问题)
– 保护因素 – 风险因素 – 唯一的产出:OR
26
专业资料,仅供医药卫生专业人士参考
病例对照研究的设计要素
• 确定研究问题 • 确定研究人群
– 病例的选择 – 对照的选择
病例与对照的选择
• 病例
– 2002年6月-2008年12月 – 广州地区6所医院 – 706名组织病理学确诊CRC患者
• 对照
– 相同时间段 – 广州地区健康体检人群 – 随机选择723名无CRC研究对象 – 年龄、性别配对
Yisheng Wei, et al. Int. J. Cancer: 125, 1876–1883 (2009)
② Independent Variable: 自变量(治疗方案)
②③
使用的检 验方法
③ Nature of Depend Variable
– Interval – Normal – Ordinal – Categorical
47
四种统计 软件的操
作方法
回归分析
• 根据研究设计和因变量(结果变量)种类 选择回归分析方法
• 疾病(事件、状态)发生、流行和分布的 影响因素:比(Hazard Ratio, Rate Ratio)
7
专业资料,仅供医药卫生专业人士参考
队列研究的设计要素
一组人 确定研究人群