中国循证医学杂志 2011, 11(12): 1427~1429• 1427 •© 2011 中国循证医学杂志编辑部C JEBM论 著 • 方法学研究GRADE指南:《临床流行病学杂志》新文章系列△GRADE guidelines: A new series of articles in the Journal of Clinical Epidemiology △Gordon H. Guyatt *,Andrew D. Oxman ,Holger J. Schünemann ,Peter Tugwell ,Andre Knottnerus ,代表GRADE 小组#摘要 GR ADE (Grades of Recommendation, Assessment, Development ,and Evaluation )方法为卫生保健中的证据质量评价与推荐强度评级提供指导。
对那些为系统评价、卫生技术评估及临床实践指南总结证据的人而言,GRADE 具有重要意义。
GRADE 提供了一个系统而透明的框架用以明确问题,确定所关注的结局,总结针对某问题的证据,以及从证据到形成推荐或作出决策。
GRADE 方法的广泛传播与应用,获全球50余个组织认可,这些组织大多有很强的影响力(/),足以证明该工作的重要性。
本文介绍临床流行病学杂志将刊出的20篇系列文章,为如何使用GRADE 方法提供指导。
关键词 GRADE ;证据质量;推荐强度;偏倚风险;卫生技术评估;临床实践指南1 引言GRADE 工作组由来自世界各地的卫生专业人员、研究者及指南开发者组成,他们自2000年开始一起工作,为临床实践指南评价证据质量及确定推荐强度开发一套理想体系。
至今该组织已有200余名成员,工作10年之后,仍不断会晤以改善并扩展该方法。
迄今,该组织已举行超过25次、每次1~2天的会议,还有难以计数的电子邮件讨论,这些共同形成了一个实验平台,用以开发和精选研究证据用于临床实践和卫生保健决策,及向临床医生、患者和决策者最好地呈现该证据的方法。
目前已发表了若干描述GRADE 方法的文章,其中最全面的是2008年发表在BMJ 上的6篇系列文章 [1-6]。
然而,这些文章的读者是使用GRADE 结果的临床医生和决策者,这些结果包括证据概要表、结果总结表和推荐强度分级(工作组开发的计算机程序GRADEpro [7]及所附帮助文件[8]使获得这些结果更加容易)。
之前的文章未能为那些负责使用GRADE 方法生产结果的人提供详尽指导:包括系统评价及卫△ 原文见J Clin Epidemiol, 2011, 64(4): 380-382.# GRADE 系统由GRADE 工作组开发。
所列作者撰写并修订了该文章。
在Journal of Clinical Epidemiology 杂志的网站上有该系列文章所有贡献者的名录。
* 通讯作者,Email: guyatt@mcmaster.ca生技术评估作者、指南委员会成员及为指南委员会提供支持的方法学家们。
本系列文章弥补了上述不足,其中前4篇已在本期《临床流行病学杂志》刊出。
本系列将包括20篇文章(表1),为使用GRADE 的每一个步骤提供指导。
文1介绍GRADE 及其在系统评价、指南及卫生技术评估中的应用,并描述用于收集、总结证据的GRADE 方法的最终结果:证据概要表和结果总结表。
文2阐述GRADE 如何用“患者/干预/对照/结局”框架来构建临床问题,及其定义关键、重要、次重要结果的方法。
前3篇引言文章的最后1篇(文3)展示了GRADE 关于证据质量的定义(对效应估计值的确信程度)。
在GRADE 的四分类体系或质量评级(高、中、低和极低)中,最开始将随机对照试验定为高质量证据,而观察性研究定为低质量证据,该文给出了这样做的理由,同时介绍了降低证据质量的5类因素及升高证据质量的3类因素。
接下来的5篇文章,即文4至文8,讨论了可能降低证据质量的5类因素。
文4涉及偏倚风险,展示了与Cochrane 偏倚风险工具类似的方法。
文5则重在探讨另一类风险——发表偏倚,此类风险也可降低证据质量。
文6介绍了考虑不精确性的GRADE 方法,该方法着重考虑围绕点估计值的可信区间,该点估计值与每一结果相对应。
文7解释了降低证据质量的第4类因素即不一Chin J Evid-based Med 2011, 11(12): 1427-1429• 1428 •C JEBM © 2011 Editorial Board of Chin J Evid-based MedMethodology致性,并指出有关的3个考虑因素:即点估计值的相似性、可信区间的重叠程度、与研究结果间异质性相关且可得的统计学检验结果。
文8显示了降低质量的最后1类因素即间接性。
间接性首先指可得研究所探讨的人群、干预措施及结局间的差异性,以及系统评价作者及指南开发者所感兴趣问题的差异性。
其次,间接性也指间接比较,即所关注的是在两种干预措施间作出推荐,而这两种措施均是分别与第三种措施进行比较,而非二者间的直接比较。
文9涉及升高观察性研究证据质量的可能性。
提出了最常见的升高质量的理由(效应量大),及两种次常见的原因(剂量-反应关系,及结论为“合理的残余混杂将进一步支持关于疗效的推断”)。
文10特别考虑结局是资源利用(成本)时偏倚风险的评价。
文11~13研究了总结证据的问题。
每一个证据群都有其局限性,对某特定结局、何时降低其质量及降低多少均具挑战性。
且GRADE 方法是分别表 1 临床流行病学杂志GRADE 系列文章引言文章1. 引言与结果总结表2. 构建问题并确定结果的重要性3. 评价证据质量——引言证据质量评价4. 证据质量评价——偏倚风险5. 证据质量评价——发表偏倚6. 证据质量评价——不精确性(随机误差)7. 证据质量评价——不一致性8. 证据质量评价——间接性9. 证据质量升级10. 资源利用证据的质量评价总结证据11. 总结单个结局的证据质量及总结多个结局的证据质量12. 准备结果总结表——二分类结局13. 准备结果总结表——连续性结局诊断性试验14. 将GRADE 应用于诊断性试验作出推荐15. 从证据到推荐——强和弱推荐的含义16. 从证据到推荐——推荐方向与强度的决定因素17. 从证据到推荐——资源利用GRADE 与观察性研究18. 利用观察性研究的特殊挑战最后的文章19. 小组方法、GRADE 的变更及GRADE 的进一步发展——第一部分20. 小组方法、GRADE 的变更及GRADE 的进一步发展——第二部分缩写:GRADE ,Grades of Recommendation ,Assessment ,Development ,and Evaluation 。
为每一结局评定证据质量,常出现的问题是不同结局间的证据质量存在差异,因此,决定所有结局证据的总体质量发人深思。
文11讨论了这些问题。
文12和文13探讨证据概要表和结果总结表制作的相关细节,文12涉及二分类结局指标而文13关于连续性变量。
文14探讨了工作组所面临的一个特殊难题,即在GRADE 框架内如何评价诊断性试验的证据质量等级。
文15和文16是关于从证据到作出推荐以及如何将推荐分为强或弱(对后者也称:弱、可斟酌处理或因情况而异)。
这2篇文章解释了与决定推荐强度有关的4个问题:备选管理方案期待与不期待结局间的权衡、证据质量、价值观与偏好的差异程度以及资源利用方面的考虑。
目前计划的该系列最后一部分包括1篇关于观察性研究特殊挑战的文章,2篇展示GRADE 工作组关于小组方法、GRADE 的变更及将来GRADE 可能发展的观点与展望的文章。
说到将来,不要指望该系列文章所展现的方法始终是应用GRADE 静态而权威的指导,其实不然。
该系列文章为着手处理许多方法论问题提供了建议。
其中的一些方法是创新的,包括如何处理替代终点,不精确所致局限性的判断标准,亚组分析可信度的评价标准,诊断性试验的证据质量评价,以及连续性变量效应量的总结等。
创新性方法具有内在的不稳定性,因而不断完善在所难免,并非所有方法均如此,但至少对其中一些是这样。
另外,不仅对崭新的东西且对那些已确立的观念在将来都存在方法论的进步与完善。
希望GRADE 用户不因我们未能提出一套应用该体系的永恒标准而沮丧。
GRADE 用户认识到该系列文章提供了一套广泛而综合的基础,使其当前及未来将GRADE 应用于系统评价、指南及卫生技术评估时处境良好,这一点可使他们恢复信心。
作为编辑,我们自豪地推出本系列文章,并相信这些文章终将被视为临床流行病学发展史上的里程牌。
参 考 文 献1Guyatt GH, Oxman AD, Vist GE, et al . GRADE: an emerging con-sensus on rating quality of evidence and strength of recommenda-tions. BMJ , 2008, 336(7650): 924-926.2Guyatt GH, Oxman AD, Kunz R, et al . What is ‘‘quality of evidence’’ and why is it important to clinicians? BMJ , 2008, 336(7651): 995-998.3 GuyattGH, OxmanAD, Kunz R, et al . Going from evidence to rec-ommendations. BMJ , 2008, 336(7652): 1049-1051.4Schunemann HJ, Oxman AD, Brozek J, et al . Grading quality of中国循证医学杂志 2011, 11(12): 1427~1429• 1429 •© 2011 中国循证医学杂志编辑部C JEBM 论 著 • 方法学研究evidence and strength of recommendations for diagnostic tests and strategies. BMJ , 2008, 336(7653): 1106-1110.5Guyatt GH, Oxman AD, Kunz R, et al . Incorporating considera-tions of resources use into grading recommendations. BMJ , 2008, 336(7654): 1170-1173.6Jaeschke R, Guyatt GH, Dellinger P, et al . Use of GRADE grid to reach decisions on clinicalpractice guidelines when consensus is elu-sive. BMJ , 2008, 337.a744.7Brozek J,Oxman AD, Sch€unemann H. GRADEpro[computer program]. Version 3.2 for Windows. Available at /gradeproor /technology.asp?page53993. 2008.8Sch€unemann H, Brozek J, Guyatt G, et al , editors. GRADE hand-book for grading quality of evidence and strength of recommenda-tion; 2010.李幼平 总审校李幼平 审校杨晓妍 译收稿日期:2011–10–15 修回日期:2011–11–25本文编辑:蔡羽嘉。