如何评价临床实验文献优劣
22
随机化与随机隐匿
随机化是指研究总体中每一个观察单位 均有同等的机会被选入试验组或对照组。
随机化方法:随机数字表、计算机软件 随机隐匿:将随机化分配序列隐藏起来, 以防止分配结局被负责纳入研究对象者 预先知晓。
23
为什么要进行随机分配隐匿
随机分配序列产生后,受试对象的入组情况就已 经确定。如果受试对象的选择者知道随机分配序 列,在病例选择过程中就预先知道下一个合格对 象的入组情况。
可信区间是按一定的概率估计总体参数 所在的范围。常用95%的概率进行估计
可信区间越宽,说明被估计的总体参数 可能的取值范围越宽;而越窄则说明总 体参数可能的取值范围越窄。
可信区间越宽,研究结果的精确度越差; 反之则越好。
42
是否同时考虑临床意义和统计学意义
关心试验措施与对照措施差异有否统计 学意义,更要关心这种差异是否有临床 意义。
33
基础治疗与基线情况
除考核的干预措施外,其他治疗是否相 同
两组间治疗前基本情况是否具有可比性 当样本含量小于200例时,即使执行了 严格的随机化程序,也有可能导致一些 基线情况不可比。
34
统计方法是否合理
多数临床研究存在的问题
统计方法的合理选择与研究设计、分析目的以及分 析的指标属性与分布类型有关。
13
3、文献评价的基本步骤
明确评价目的
明确文献的研究类型 确定评价内容与顺序 选择评价方法及评价工具
14
4、文献评价过程
明确评价目的
评价目的不同,决定了评价内容和重点各有 侧重 疗效、病因、预后、诊断、卫生经济学评价 评价结果受评价者自身能力与水平的限制, 需要学习和掌握临床流行病学原则与方法, 以确保评价结果的真实性和结论的可靠性。
167
外科手术的RRR=16.7%
30
研究对象流程图
31
盲法
盲法的重要性
盲法的设置 设置盲法的目的
32
随机分配方案隐匿与盲法比较
两者的作用目的、实施阶段与可行性不一样
前者目的是为了避免选择性偏倚,作用在受试 者分配入组之前,在任何随机对照试验中都可 实施。 后者的目的是为了避免受试对象和研究人员的 主观偏倚,作用在受试对象分配入组并接受相 应干预措施后,并不是任何随机对照试验都可 全部实施。
如:大型临床试验证明使用β-受体阻滞剂 对心力衰竭有益,而对一名伴有糖尿病的患 者是否有应适?
12
(2)重要性评价
指研究结果本身是否具有临床价值
包括临床重要性与统计学意义相方面, 两者应相互结合,缺一不可。 常需要借助于一些定性或定量指标来进 行
如:相对危险度降低率RRR,绝对危险度 除低率ARR、防止一例某种事件发生需要治 疗的病例数NNT,等。
亚组分析风险
基于全部受试人员得到的结论可靠性远大于只基于部分 人群分析的结论可靠性。 探索性亚组分析(事后)不可避免地带来偏性 但确证性亚组分析(事先设计)结果同样可靠。 35
合理设置对照
无对照试验不能肯定干预措施的真正疗效
疾病自愈倾向
安慰剂效应
X线照射脑垂体治疗高血压,X线组17(25)
药物 Periactin Temaril 安慰剂 不给药
瘙痒计分 27.6 34.6 30.4 49.6
缓解率% 44 30 39 19
38
不合理的对照
历史对照
自身前后对照 同期非随机对照(按病人的意愿,两组分 属两个医院等)
39
非随机对照试验结果可信的条件
某种疾病不容易误诊
临床研究文献质量的 严格评价
主要内容
概述
随机对照研究文献的严格评价 其他类型研究文献的严格评价
2
一、概述
1、临床研究文献评价的重要性
来源复杂 质量良莠不齐 应用时需要结合患者的具体 情况
3
2、文献评价的内容
内部真实性 外部真实性(即适用性)
重要性
4
真实性(validity)
15
4、文献评价过程
明确文献的研究类型
原始文献:随机对照研究、队列研究、病例 对照研究、现况研究等 二次文献:系统综述等
16
4、文献评价过程
确定评价内容与顺序
按内部真实性、重要性与适用性的顺序对文 献展开评价
17
4、文献评价过程
选择文献质量评价工具
清单类(checklist) 尺度类(scale)
组间基线状况是否均衡可比、有无相关偏倚因 素存在以及是否采取了相应的防止或处理的措 施、依从性如何? 对相应的试验观测指标及资料所采用的整理、 统计分析方法是否恰当
11
(2)外部真实性(适用性)评价
外部真实性、适用性、外推性
指研究结果或结论在不同人群、不同地 点和针对具体病例的推广应用价值。
假定治疗组所有失访者为阴性结果或发生了不良事 件,而对照组的所有失访者为阳性结果或没有不良 事件,进行统计处理。
27
不完全结局数据
参与了随机分组的患者是否全部进行了 分析
意向性分析(intention-to-treat, ITT):根据研究对象最初分组的情况进 行分析,不考虑分组后发生的情况。
P=0.02
151
外科手术的RRR=26%
29
结论是否包括纳入研究的全部研究对 象
内、外科治疗双侧颈动脉狭窄的随机对照试验
暂时性脑缺血发作、卒中或死亡 组别 外科手术组 内科药物组 是 43+15 53+1 否 36 19 病人数 94 (61.7%) 73 (74.0%)
χ2 =2.Байду номын сангаас0
P=0.09
有时,研究人员为了让具有某种特征的受试对象 接受某种干预措施以获得有益于该干预措施的结 果,就有可能改变随机分配序列,不按照事先产 生的分配序列分配对象,而导致选择性偏倚。
24
隐匿随机分配方案的方法
研究表明:与分配方案隐藏完善的试验相比, 未隐藏分配方案或方案分配隐藏不完善的试验, 常常夸大治疗效果30-41%。 中心电话随机(central telephone randomization)
常用的效应指标有: 绝对危险降低率(ARR)=Pc-Pe
相对危险降低率(RRR)=(Pc-Pe)/ Pc
需治疗人数(NNT)=1 / ARR
43
某项降血脂试验的疗效分析
组别 心梗发 生率 0.08 RRR ARR NNT
试验组
0. 5
0.08
13
对照组
0.16
44
统计学意义只是告诉我们这种差异极可 能是真实的,而不能指出这种差异是否 有临床意义 P<0.05?
假动作组14(18)
霍桑效应:指人们因为成了研究中特别感兴趣 和观察的目标而改变他们的心理和行为的一种 倾向。受试者只对特别注意产生兴趣而不是疗 法本身。 36
试验性治疗真实效应示意图
新疗法
传统疗法 安慰剂+霍桑效应 自然 转归 37
两种“有效”药物和一种安慰剂与不给药 对慢性瘙痒控制的比较
20
(二)随机对照研究评价要点
1、内部真实性评价
2、重要性评价
3、适用性(实用性)评价
1、研究结果是否是真实的?
1.是否采用了真实的随机法?是否采取随机隐匿
2.是否随访了纳入研究的所有患者?是否报告了失 访情况?
3.是否随机分配入组的所有患者都进行了分析?
4.对照设置是否合理?是否采用了盲法? 5.是否保证了组间基线状态的可比性 6.是否注意了辅助治疗的影响 7.选择的统计分析方法是否合适?
差异确有临床意义而没有统计学意义, 提示样本量不足,效能过低。
结果有统计学意义而没有临床意义,说 明其应用性差。
45
3、研究结果的适用性(外部真实 性)
研究中的患者与临床实际中的患者有何 差别
研究中的治疗措施是否现实可行 是否报告全部临床结果
46
研究中的患者与临床实际中的患 者有何差别
该研究全过程采取措施防止了偏倚发生,因而公认其 结论内部真实性较高。但是,该结论对于女性或非退 役军人是否有效?对于舒张压不在115 ~ 129mmHg 范围内或已有高血压并发症的病人是否也有效呢?该 研究是无法解决这些问题的。
10
(1)内部真实性评价
研究结果是来自何种设计方案
有无对照以及设置是否恰当 对象选择是否合理(诊断、纳入与排除)
6
2)外部真实性(external validity)
定义 研究结果与推论对象真实情况的符合程度,又称普遍 性,回答一个研究能否推广应用到研究对象以外的人群。 有内部真实性的结果推广到靶人群以外的其他人群仍然 有效,称之为具有外部真实性。
影响因素 研究人群与其他人群的特征差异、研究对象类型等因 素的影响。
改善措施 增加研究对象的异质性 7
3)内部真实性与外部真实性的联系
没有内部真实性的结果必定没有外部真实性,具有内部真 实性的结果也未必都有外部真实性。 增加研究对象的同质性(如限制类型如年龄、职业、体质 特征或疾病分型等),可改善内部真实性。 增加研究对象的异质性,可改善外部真实性。 在研究中经常将只有内部真实性而无外部真实性的结果任 意推广应用至靶人群以外的其他人群,导致张冠李戴、南 辕北辙、贻误时机。 在实际研究中需综合考虑研究对象的同质性和异质性问题。 8