当前位置:
文档之家› 第八章 诊断试验的设计与评价(2学时)
第八章 诊断试验的设计与评价(2学时)
ua n (1 p) p
公式中n为所需例数,u/2为检验水准所对应的双侧正态分布界值, P为灵敏度或特异度的预期值, 为允许误差。 样本量的估计主要取决于灵敏度、特异度和允许误差(一般0.050.10)三个参数。如果为了排除疾病,需要诊断方法的灵敏度较高; 如果为了确诊疾病,需要诊断方法的特异性较高。 也可用查表法来估计样本含量
(2)诊断指数(约登指数(Youden Index,YI) )
是将灵敏度与特异度相加,反映诊断方法发现病人和 非病人的总的能力,表示诊断试验判断真正患者和非 患者的总能力。 同时考虑灵敏度和特异度的指标 数值越大,真实性越好 DI=灵敏度+特异度-1
(3)符合率(agreement rate) 指诊断试验中真阳性和真阴性之和占总受检人数的比 例。表示观察值与标准值或真实值符合的程度。又称 准确度。 符合率=(A+D)/(A+B+C+D)
筛检试验 患者 阳性
金标准 非患者 假阳性 B 真阴性 D
合计
真阳性 A 假阴性 C
R1 R2
二、真实性
阴性
合计
C1
C2
N
1. 灵敏度(sensitivity):指在“金标准” 确诊的病人中,待评价的诊断试验检测 A 灵敏度 100% 出的阳性人数所占的比例。将实际有 AC 病的人正确判断为患者的能力。真阳 性率 假阴性率(false negative rate,漏 诊率):指在“金标准”确诊的病人 中诊断试验检测出的“阴性”人数所 占的比例。将实际有病的人错误判断 为非患者的比例。
康 临床期
复
易感期
临床前期
残疾、死亡
疾病发生
出现症状
图9-2 疾病自然史与筛检、诊断示意图
筛检试验
诊断试验
开始暴露
临床前可 检查期
诊断 治疗
康 临床期 复
易感期
临床前期
残疾、死亡
疾病发生 图9-3
出现症状 疾病自然史与筛检诊断示意图
图7-4
筛检试验流程图
筛检试验与诊断试验的区别
筛检试验 对象 目的 要求 费用 健康人或无症状的病人 发现可疑病人 病人 对病人进行确诊 诊断试验
多数情况下,患者例数少于非患者例数,故符合率受 特异度的影响大于灵敏度的影响。
筛检试验 患者 金标准 非患者 合计
阳性
阴性 合计
真阳性 A
假阴性 C
假阳性 B
真阴性 D
R1
R2 N
C1
C2
三、诊断试验中正常值临界点的选择
人群中青光眼患者与非青光眼患者眼内压分布
ROC曲线
ROC曲线( receiver operator characteristic curve,受试者工作特征曲线) 的横轴表示假阳性率 (1-特异度),纵轴表示灵敏度,曲线上的任意一个 点代表一项诊断方法的特定阳性标准值相对应的灵敏 度和特异度对子。 表示一个特定的诊断方法对区别特定的患者组与非患 者组样本的检测性能。
二、诊断试验的用途
诊断疾病 筛选无症状的病人 判断疾病的严重程度 估计疾病临床过程及预后 估计对治疗的反应 评价判断治疗效果
三、诊断试验的研究设计程序
1.选择一个“金标准”, 2.用“金标准”去筛选一定数量的患有和未患 有某种疾病的研究对象,分为“病例组(有 病)”与“对照组(无病)” 3.用待评价诊断方法同步地盲法测试二组研究 对象。 4.将所获得的结果与“金标准”的诊断结果进 行比较,用一些特殊的指标来评价诊断方法的 价值(第二节详细讲解)。
金标准 诊断试验 病人 非病人 合计
阳性
阴性
18
2
49
931
67
933
合计
20
980
1000
第二节 诊断试验的评价
诊断方法是对人体无害、操作简便、出结果迅速、 费用低廉,还要考虑诊断方法的真实性、可靠性和 收益三个方面。
一、诊断方法的评价内容
1、真实性(validity)。准确度(accuracy)、效度 (validity)。是指一般测量工具的实际测量结果与真 值(true value)之间的接近程度。在诊断方法的评价 中,真实性是指诊断方法的检测结果与“金标准”的检 测结果的符合程度,用灵敏度和特异度表示。 2、可靠性( reliability )。精确度(precision)、信 度(reliability)和可重复性(repeatability)。是 指在相同条件下针对同一事物,测量工具重复测量其结 果的稳定程度(stability)。在诊断方法评价中,可靠 性是指在相同条件下针对同一研究对象,重复检测其结 果的稳定程度,或一致性(consistency)、重现性。
上诊断试验的诊断价值。
糖尿病试验不同血糖的灵敏度和特异度分布
餐后二小时血糖 (mg/100ml)
70 80 90 100 110 120 130 140 150 160 170 180 190 200
灵敏度%
98.6 97.1 94.3 88.6 85.7 71.4 64.3 57.1 50.0 47.1 42.9 38.6 34.3 27.1
2
例 肿瘤标志物CA19-9是临床上用来诊断胰腺癌的指 标之一,其对诊断胰腺癌的灵敏度估计为77.3%,特 异度估计为73.9%,若设定容许误差δ =0.08,检验水 准 =0.05( u/2=1.96),试问需要多大的样本量才 能具有统计学意义?
试验组的样本量估计
1.962 0.773 (1 0.773) n 53.7 54 2 0.08
LR 假阴性率 1 灵敏度 真阴性率 特异度
某卫生机构为了评价物理检查在急性化脓性咽炎诊断中的真实性, 以咽拭子培养甲组乙型溶血性链球菌作为“金标准”,
病人 物理检查 阳性 阴性 合计 54 11 65
非病人 21 142 163
合计 75 153 228
阳性似然比=(54/65)/(21/163)=6.45 阴性似然比=(11/65)/(142/163)=0.19 说明病人中出现检查阳性的机会是非病人的 6.45 倍;还说明病 人中出现检查阴性的机会是非病人的0.19倍。
第九章
筛检与诊断试验的设计与评价
筛检试验:是运用快速、简便的试验、检查
或其他方法,将健康人群中那些可能有病或 缺陷、但表面健康的个体,同那些可能无病 者鉴别开来。简便、价廉、易被接受。用于疾
病的二级预防
诊断试验:为临床医生选择诊断提供依据。诊 断与鉴别诊断
开始暴露
诊断 治疗 康 复
易感期
表示不同诊断水平的真阳性率对假阳性率的函数关系。
ROC曲线
作用: 1、客观反映灵敏度和特异度之间的关系;
2、正常值临界点的选择;
3、比较两种或两种以上诊断试验的价值
ROC曲线评价方法
以灵敏度和假阳性率为两个轴的取值作的图形; 通常用于测定值为连续或等级数据; 常用于确定最佳临界值,也可用于比较两种和两种以
灵敏度和特异度的关系
都是反映诊断试验准确性的最基本指标 提高一方面水平,会降低另一方面水平 一般选择敏感度和特异度都较高的试验作为诊断依据 根据研究目的,调整灵敏度和特异度来确定临界值 以产生漏诊和误诊之和最小时的数据确定临界值
3、灵敏度与特异度的综合评价
灵敏度与特异度是一个事物的两个方面,存在本质的 联系,不可能截然分开。而且,分别评价灵敏度和特 异度不利于全面把握诊断方法的真实性。 综合评价指标 (1)似然比(likehood ratio, LR) (2)诊断指数(Youden’s index) (3)符合率
金标准
+
目 标 人 群
病人 - 待评价的 方法 + 非病 人 -
评价指标
图7-5 筛检或诊断试验的评价程序
[一]“金标准”的确定
是指目前医学界公认的诊断某种疾病最准确可靠的方 法或手段。 通常,一种疾病有一个“金标准” 常用的金标准包括 病理学诊断(活检、尸检) 外科手术或诊断性操作 特殊的影像学诊断 权威机构颁布的综合诊断标准
[二] 研究对象的选择
总的原则是:研究对象应能代表诊断方法可能应用的靶 人群。
\ 病例组应当包括所研究疾病的各种临床类型:轻、中、 重型,早、中、晚期,典型的和不典型的,有和没有并 发症者,治疗过的与未治疗过的,使病例组对该病的总 体具有代表性,使评价的结果对该病具有普遍的意义。
[二] 研究对象的选择
临床前期
临床期
残疾、死亡
疾病发生
出现症状
图9-1 疾病自然史
如果疾病在临床前期出现一些可以识别的异常特征, 如肿瘤的早期标识物(biomarkers)、血压升高、血脂 升高等,则可使用一种或多种方法将其查出,并对其做 进一步的诊断和治疗,则可延缓疾病的发展,改善其预 后
开始暴露 诊断 治疗
临床前可 检查期
(1)似然比(likelihood ratio,LR)
在诊断试验评价中,特定方法的似然比被界定为:病 人中出现某种检测结果的概率与非病人中出现相应结 果的概率之比,说明病人出现该结果的机会是非病人 的多少倍。 一项诊断效率高的诊断方法应该是真阳性率高,假阳 性率低。这二项之比称为该诊断试验的似然比,似然 比愈大,诊断的价值也愈大。
快速、简便、安全,高灵 复杂、准确性和特异度高 敏度 经济、廉价 花费较高
处理
用诊断试验确诊
严密观察和及时治疗
第一节 诊断试验的研究设计
一、定义
诊断试验(diagnostic test)即给病人做出诊 断所应用的各种实验室检查、医疗仪器检查及其 他方法。 随着医学科学的发展和对疾病认识的不断深化, 新的诊断试验不断出现以代替旧的诊断试验应用 于临床。为了提高诊断水平,应研究和评价这些 新的诊断试验,以确定其能否取代或充实现有的 诊断方法和能否推广。