第三章证据的分类分级与
第四节 GRADE标准 的特点及应用
57
一 GRADE标准特点
证据质量指在多大程度上能够确信疗效评估的正确性; 推荐强度指在多大程度上能够确信遵守推荐意见利大于弊; 反映一项干预措施是否利大于弊的确定程度
58
【GRADE标准的优势】 1.由一个具有广泛代表性的国际指南制定小组制定; 2.明确界定了证据质量和推荐强度; 3.清楚评价了不同治疗方案的重要结局; 4.对不同级别证据的升级与降级有明确、综合的标准; 5.从证据到推荐全过程透明; 6.明确承认价值观和意愿; 7.就推荐意见的强弱,分别从临床医生、患者、政策制
12
13
二次研究类型
系统评价(systematic review, SR/Meta analysis) 临床实践指南(clinical practice guidelines, CPG 临床决策分析(clinical decision analysis) 临床证据手册(handbook of clinical evidence) 卫生技术评价(health technology assessment,
解决临床问题,包括: 发病与危险因素→认识与预防疾病; 疾病的早期诊断→提高诊断的准确性; 疾病的正确合理治疗→应用有疗效的措施; 疾病预后的判断→改善预后,提高生存质量。 合理用药和促进卫生管理及决策科学化。
询证医学五步法
第三章 证据的分类、分 级与推荐
9
什么是证据?
10
第一节 临床研究证 据的分类
64Βιβλιοθήκη 、证据强度解释1)强推荐的含义 对患者:在这种情况下,多数患者会采纳推荐方案,只有少数
不会;此时若未予推荐,则应说明。 对临床医生:多数患者应该接受该推荐方案。 对政策制定者:该推荐方案在大多数情况下会被采纳作为政策
。 2)弱推荐的含义 对患者:在这种情况下,绝大多数患者会采纳推荐方案,但仍
20
各种证据如何分辨质量?
21
第二节 临床研究评 价
22
为什么要评估证据的质量?
大多数干预措施的效果不是非常显著,有的甚 至可对病人造成伤害。
应当对文献等证据进行评价。
23
对文献质量进行评价的意义:
可作为是否纳入研究的标准; 用于解释研究结果间的差异性(异质性); 用于敏感性分析; 作为研究结果统计学分析时赋予权重的根据,
不同亚型,不同特征的患者人群。
31
结果是否有助于处理我的病人
✓ 结果能否用于自己的病人 -检查样本的代表性:研究人群与我的病人越接近, 应用结果的把握就越大
✓ 是否考虑到临床上所有的重要结果 ✓ 治疗的利与弊
① 治疗作用;肺癌,保守/开放治疗 ② 不良事件;SARS,类固醇治疗 ③ 费用:公费,自费,病人经济状况 32
临床问题 疗效评价
治疗的不良反应
最佳的研究设计 RCT
RCT
诊断或筛查试验
与金标准进行盲法比较
预后评价
队列研究
无法进行RCT或有伦理问 队列研究 题的疗效评价
暴露不良环境的危害
病例对照研究
27
不同临床问题的相似评价标准
➢ 研究结果科学性:是否真实可信? ➢ 研究结果的是什么?有多大? ➢ 研究结果能否应用于我的病人,解
治疗组和对照组之间预后因素分布的 差异
由医生决定给予治疗可造成偏倚 通过配对等方法可减少各干预组之间
的差异、控制该混杂因素,但对于未 能识别的混杂因素,仍可能影响结果。
38
随机对照临床试验(RCT)
随机临床试验是最严格的方法 随机试验也可能存在受偏倚的影响,
对其方法学质量进行评价是必要的。
39
随机对照临床试验的三大要素
各种证据是否具有相同的重要性?
33
第三节 临床研究证 据的分级
34
分级的依据
证据来源 证据科学性
证据可靠程度
35
分级始于研究设计 各类设计具有不同的优缺
点
36
非系统性临床观察研究
临床医生对疾病的非系统性观察 病例报告 病例分析 专家评论
无对照、样本量小 存在较大的偏倚
37
非随机研究
➢ 是否用双盲; ➢ 是否交待全部研究结果; ➢ 随访的完整性,有无干扰;
30
预后研究评价
患者是否在病程的相同起点开始随访; 随访的完整性:从纳入研究到研究规定的终点,
失访率高低直接影响研究结果的真实性; 结果评定标准的客观性:定义结果的测量或评价
标准,评价标准要有足够的客观性; 对影响预后的重要因素是否进行校正,如疾病的
63
证据质量与推荐强度的表达方式
证据质量 高质量
中级质量 低质量
极低级质量
表达方式 ⊕⊕⊕⊕或A ⊕⊕⊕○或B ⊕⊕○○或C ⊕○○○或D
推荐强度
支持使用某干预措施的 强推荐
支持使用某干预措施的 弱推荐
反对使用某干预措施的 弱推荐
反对使用某干预措施的 强推荐
表达方式 ↑↑或1 ↑?或2 ↓?或2 ↓↓或1
43
代表性分级标准
加拿大定期体检特别工作组(CTFPHE标准): 1979年,三级标准
美国胸内科医师学会(ACCP标准) :1986年, 五级标准
美国卫生保健政策研究所(AHRQ标准) :1992 年,四级标准
苏格兰院际指南网络(SIGN标准 ):2001年,四 级
牛津大学循证医学中心:1998年,五级 推荐分级的评价、制定与评估(GRADE标准):
11
按研究方法分类
原始临床研究数据:直接在受试者中进行单个 有关病因、诊断、预防、治疗和预后等试验研 究所获得的第一手数据,进行统计学处理、分 析、总结后得出的结论。
二次临床研究数据:全面收集某一问题的全部 原始研究证据,进行严格评价、整合、分析、 总结后所得出的综合结论,是对多个原始研究 证据再加工后得到的证据。
设立对照组 随机分组
方法:简单随机化、区组随机、分层随机 双盲(Double blinding)
外观一致的对照药或安慰剂 双盲双模拟(double dummy) 开放试验、单盲
40
随访
退出和失访 已纳入的病例发现不符合纳入标准 出现药物副作用的病例 对分配的治疗不依从的病例
41
16
按用户需要分类
政策制定者:政府官员、机构负责人 等(禁烟、禁反应停)
研究者:临床和基础研究教学人员等 (研究立项)
卫生保健人员:医生、护士、技师等 (诊断和治疗)
患者和公众:患病和健康人群(个人 保健、康复)
17
19
临床研究证据的来源
数据库资源 网站资源 杂志 会议文献 在研和未发表的临床试验
定者角度作了明确实用的诠释; 8.适用于制作系统评价、卫生技术评估及指南。
59
二 影响证据质量的因素
一)可能降低证据质量的因素 1)研究的局限性
研究的局限性包括隐蔽分组缺失、盲法缺失(特别是结局指标为主观性指标 且对其评估极易受偏倚影响时)、失访过多、未进行意向性分析、观察到疗 效就过早终止试验或未报道结果(通常是未观察到疗效的一些研究)。 2)研究结果不一致 不同研究间大相径庭的疗效评估(异质性或结果的差异)意味着各种疗法的疗 效确实存在差异。差异可能源于人群(如药物对重症人群的疗效可能相对显 著)、干预措施(如较高药物剂量会使疗效更显著)或结局指标(如随时间推移 疗效降低)。 当结果存在异质性而研究者未能意识到并给出合理解释时,证据质量亦降低 。
62
三 影响推荐强度的因素
推荐强度反映对一项干预措施是否利大于弊的确定程度。 干预措施的有利方面包括降低发病率和病死率、提高生活
质量、降低医疗负担和减少资源消耗。 不利方面包括增加发病率和病死率,降低生活质量或增加
资源消耗等。 GRADE系统只有强弱两级推荐,为方便使用GRADE还为
证据质量和推荐强度提供了首选的符号描述法,也为喜欢 使用数字和字母形式的机构提供了首选的数字/字母描述法
强调做任何事情都应该: 以事实为依据 —— 询证决策 不断补充新证据 —— 与时俱进 后效评价实践效果 —— 止于至善
结果是: 强调实事求是,提高了决策的科学性 注重决策质量,提高了决策的成本-效果
询证医学的特点
基于问题,立足于用,以人文本 需求驱动,方法保障,查证用证,后效评价
询证医学的目的
系统评价中对RCT质量评价内容
研究的质量 随机分组、方法、编盲 盲法;双盲、单盲、开放性 随访:病例是否完整 分析方法
影响结果解释的因素 偏倚的来源
42
对研究质量的处理
排除质量低的研究,但有排除产生真 实性结果研究的危险
纳入低质量的试验同时探讨质量高低 对效应估计值的影响 用敏感性分析探讨排除低质量研究对 系统评价结果证据强度的影响 使用Meta回归模型 累积性Meta分析
具体描述
未来研究几乎不可能改变现 有疗效评价结果的可信度 未来研究可能对现有疗效评 价有重要影响,可能改变评 估结果的可信度 未来研究很有可能对现有疗 效评估有重要影响,改变评 估结果可信度的可能性较大 任何疗效的评估都很不确定
推荐级 具体描述 别
强
明确显示干预
措施利大于弊
弱
利弊不确定或
者利弊相当
56
即结果越精确或质量高的赋予较大权重
24
质量评价的局限性
研究质量低可能与研究报告不恰当有 关 与作者联系,补充或核实情况
真实性的测量标准与实际研究的结局 之间的联系?
25
临床研究评价的目的
减少或纠正偏倚及混杂,获得科学的 临床研究结果: 严格的临床科研设计方法; 采用合适的统计学方法。
26
不同临床问题需要不同的研究设计
有不少患者不采用。 对临床医生:应该认识到不同患者有各自适合的方案,帮助每
个患者作出体现他(她)价值观和意愿的决定。 对政策制定者:制定政策需要实质性讨论,并需要众多利益相