第十一章临床检验方法评价本章考点:1.基本概念和定义(了解)2.临床检验方法评价(掌握,重点)3.评价分析方法(了解,难点)4.评价方法可接受性(熟悉)5.应用范例:血清葡萄糖70年代由Barnett和Youden首次提出了选择和评价临床实验室的客观计划。
由国际临床化学联合会(IFCC)提供的文件提供了方法评价名词术语和哲学思想的一般讨论以及它与整个质量保证过程的相互关系。
在1992年7月,病理学和检验医学档案包含了几篇有关方法评价的有用文章。
也出版了该主题的书籍。
美国国家临床检验标准化委员会(NCCLS)已制定了当进行方法学评价时,临床实验室人员和厂家执行的协同一致的草案。
本章的目的是描述临床实验室人员能用于客观地选择和评价分析方法的技术。
为了实现这一目标,我们提供了(1)与方法学选择和评价过程密不可分的基本概念和定义的讨论;(2)选择候选方法的程序;(3)性能标准的讨论;(4)逐步描述如何评价候选的方法;(5)用于可接受方法的标准的描述。
任何新方法(包括新的试验原理、新的仪器和新的试剂)在正式投入常规应用前都必须进行的评价程序。
图6-11-1中显示的关键步骤为方法选择、方法评价和质量控制。
为了证实这种信息如何用于实际情况,我们在本节结束时举一实例。
新的或修改的方法引入到临床实验室对临床实验室专业技术人员期望保证高质量的服务来说是经常性的任务。
方法的选择和评价是执行新方法过程的关键步骤(见图6-11-1)。
因此,良好的实验室规范(实践)要求必须仔细地选择新的或修改的方法,在常规应用之前对其性能必须在实验室条件下进行严格和公正的评价。
一、基本概念和定义见表6-11-1指出新方法成功评价的五个关键要点。
抓住这5个关键点,成功的方法评价就能实现。
方法选择和评价过程必须开始于临床。
评价过程应寻求知道候选方法是否具有足够的分析重复性和准确度来产生结果,使其为临床所用。
统计的和经济的考虑也是重要的,但是要与临床方面进行比较。
例如,对于方法评价需要统计技术,但是统计的显著性意义并不能提供判断方法的可接受性的基础。
关于接受或拒绝的决定应基于数据可进行误差的估计,并为临床所接受。
实验成本的压力也已成为特别重要,但不是唯一因素。
在选择候选方法时需要对其进行考虑。
表6-11-1 新方法成功评价的关键点1.整个任务应用临床观点;2.在开始之前,设定目标-分析目标;3.执行正确的试验,收集所需的数据;4.正确地使用统计工具,以便正确地估计误差;5.作出客观方法的正确评论。
二、临床检验方法评价(重点)(一)需求的确定建立检测的需求是选择候选方法的第一步(见图6-11-1)。
这种需求可能由以下情况提出:①临床医师的建议考虑增加新的诊断试验。
②新方法与已存在的方法相比,将提供改进的不准确度或精密度。
③用更有效的程序替换老的、劳动强度大的检测方法。
在开始时,通过仔细地描述候选方法的要求,选择和评价的过程以直接和有效的方式来进行。
因此,这些要求指导选择评价分析方法的全过程。
这一过程是质量管理连续环中质量计划分量的一部分。
(二)方法选择选择候选方法是引入新方法到实验室过程的第二步骤(见图6-11-1)。
实践要求在决定是否将新的方法或仪器在某一实验室执行前,一些实际的因素必须首先考虑。
它们包括标本类型、样本量、分析能力、周转时间、试验菜单、标本处理、分析批的大小、人员技能要求、每一试验的成本、校准方法、校准频率、随机处理能力、质控方法、空间需求(包括试剂储存)、废物处理要求、以及化学危险物和安全的考虑。
通过分析人员、监督人员和主任之间的讨论使实验室人员能确定大多数的实际要求。
实际的信息也可从描述方法或仪器的文献中获得。
很明显,如候选方法的实际特征与实验室的要求不一致的话,其将不会被采用。
可采用不同的途径来识别候选的方法,包括复习科学文献、咨询同行、评价商业的资料(三)确定质量目标1.性能参数与方法或仪器性能有关的特征包括其准确度、分析范围、分析回收、分析灵敏度、分析特异度、空白读数、检出限、干扰、精密度、试剂稳定性、“稳健性”及样本的交互作用等。
对这些参数的评价来评价方法的性能;这些研究的结论然后可作为临床使用是否是可接受的基础。
“医学实用性”的定义可能要求实验室人员与临床人员之间的交流。
性能要求取决于试验结果的预期用途或在其医学上不同的应用;因此,可产生不同的准确度和精密度的目标。
2.性能标准为了客观地选择和评价候选的方法,在开始分析试验之前和在试图获得作出方法的适应性之前,需要建立性能标准(或称质量目标或分析目标)(见图6-11-1和表6-11-1)。
如果没有首先制定性能准则,执行评价试验来估计误差和作出方法可接受性的结论将减少研究的价值和有效性,并可导致作出像“很好的质量”、“比较后很好”、“证明具有可接受的性能”主观陈述的结论。
明智的实验室人员必须询问这样的结论是否有效。
通过在执行试验和获得评价数据之前,建立允许的分析误差大小的规范而没有使分析试验结果实用性无效的性能目标,就可避免出现疑问。
实际的性能可以与目标进行比较来确定方法的可接受性。
(1)要求性能目标应规定在特定浓度或分析物活性上允许的总误差。
在医学决定性水平(Xc)选择这些浓度,此种试验结果对于临床医师作出诊断、监测或治疗决定的解释时是非常关键的。
当分析物有不同的医学应用时可制定几个水平。
例如,钙需要的关键浓度有①高钙血症;②高到正常的钙;③低钙血症(见图6-11-4)。
因此,评价测量钙的候选方法需要在这些关键浓度上设计来估计误差。
(2)建立质量目标检验项目的分析质量技术要求对于临床应用是非常有用的。
分析质量技术要求可表现为允许不精密度(CV%)、允许偏倚(Bias)和允许总误差(TEa)等形式,其中最重要的是允许总误差要求,它是医学实用性所能耐受的分析误差的大小。
制定的上述性能标准,既能反映临床应用与解释结果的要求(称为为医学效用限度),又应基本符合实验室所能达到的技能转台。
医学实验室所使用的方法要求在不精密度、不准确度和总误差上应小于这些分析质在文献中已发表了建立分析质量目的的指南。
Barnett是第一位在此领域进行研究的学者,并在中期发表了对临床医师进行调查的研究结果。
他后来继续他的研究并更新了一些目标,以及与Skendzel和Platt等人合作增加了其他的目标。
欧洲工作小组,使用生物学变异作为基础,推荐了三种水平的分析目标:“最低的性能”、“期望的性能”和“最佳的性能”。
对于期望的性能,他们建议的精密度目标是1/2的试验的个体内生物学变异。
对于偏倚,他们推荐的是1/4的生物学变异,或1/16参考区间,或者是缺乏其他准则时,采用两倍的理想的精密度。
美国临床实验室改进修正案(CLIA)法规对方法选择和评价过程最具有影响意义在于对特定的法定分析物建立了评价方法和实验室性能的固定限(见表6-11-2)。
CLIA法规具有的法律和惩罚结果,这些界限目前已成为美国最大的允许误差界限。
因此,在实际工作中,给定的分析方法的允许总误差必须小于分析物CLIA固定界限。
例如,为了实验室产生能力验证计划样本的可接受性能,Ehrmeyer和同事建议他们必须将偏倚降低到最小,并且将室内的变异系数降低到1/3的CLIA固定限目标。
他们的建议是假定测定过程稳定。
Barnett和Westgard进一步建议方法的变异系数应不超过1/4的CLIA界限,这样包括了不稳定性能的可能性及使用成本效率的质量控制程序。
在这基础上,将CLIA’88限除以4可以与s规范进行比较。
表6-11-2 推荐允许误差分析项目决定性水可接受性能精密度目标固定限目标平Xc (CLIA’88)(最大标准差)(最大总误差)Xc*CLIA/4 Barnett Fraser CLIA’88丙氨酸氨基转移酶50U/L 20% 2.5 5.8 10总钙7.0mg/dl 1.0 0.25 0.16 0.06 1.010.8mg/dl 1.0 0.25 0.24 0.10 1.013.0 mg/dl 1.0 0.25 0.30 0.12 1.0以下略。
Westgard和同事已将CLIA’88限于大多数项目的医学结果准则进行比较,发现胆红素、铁、白细胞计数和尿素等项目不太严格。
与欧洲工作组准则比较,发现11个项目的CLIA’88限更严格,12个项目没有欧洲准则严格。
Rej和Jenny报告纽约州实验室执行CLIA法规很好,98%以上的实验室对于大多数项目可通过能力验证计划。
Ehrmeyer,Burmeister和同事发现了类似的结果。
1994年威斯康星州头两次能力验证计划,95%以上的实验室成功地通过常规化学分析物试验,对于毒理学、内分泌和免疫学执行得更好。
因此,CLIA限能被用于建立候选方法的性能准则。
我们认为这是一种方法评价的实用和合理的方法,并且要比性能满足厂家提供的规定接受方法的实践要好得多。
以前,厂家建立它们的性能目标是基于在市场上竞争的要求而不是需要满足每一试验临床质量要求的是实际性能。
然而,在最近几年的证据和个人交流表明,厂家越来越更多地使用CLIA限来建立性能声明和它们的产品的规范。
在表6-11-2中列出了来自CLIA’88和两种其他来源的最大标准差误差目标及CLIA’88固定限目标。
只要可能,以使用决定性水平或临界浓度(Xc)的浓度单位计算误差标准。
这些决定性水平资料是来自Barnett参考限的工作或分析物的治疗区间。
钙的浓度是与图6-11-4中显示的一致,目前正在使用胆固醇浓度来确定动脉粥样硬化患者的危险性。
(四)方法评价1.评价方法:(1)检测方法实验室使用的分析方法包括:决定性方法、参考方法和常规方法。
实验室应根据检测工作的需要,选用不同的分析方法。
对于大多数实验室来说,应用最广的方法是常规方法。
还有一些其他检测方法,如可比较的方法均值,参考实验室均值,以及同组的均值。
按准确度降低的顺序:决定性方法,参考方法、可比较的方法均值,参考实验室均值,以及同组的均值(基于方法组的均值)。
(A)决定性方法(B)参考方法是在工业和临床实验室由有经验的工作人员执行的更高精度的方法。
参考方法的结果可溯源到决定性方法。
由决定性方法验证的一级参考物质被用于参考方法的开发和校准。
(C)比较方法均值是选择方法能力验证试验结果的平均值。
它们可通过使用不同的仪器和技术的多个实验室产生的平均结果而获得。
将测量值与这些平均值作比较是评价测量准确度的常见方法。
选择用于计算比较方法的平均值的方法,因为多年来它们具有可靠的性能。
证据表明这些公议值经常与近似的真值非常接近。
(D)同组均值是使用相同仪器和技术从几个实验室获得的能力验证试验结果的平均值。
同组均值可允许实验室通过与其他实验室使用相同的仪器的比较来评价自己仪器的准确度。