偏倚及其控制
9
南京医科大学康达学院
二、研究的真实性(Validity) 概念
研究收集的数据、分析结果和所得结论与客观 实际的符合程度。也称“有效性”、“效度”。
影响真实性的因素
随机误差 系统误差
10
南京医科大学康达学院
真实性的两个方面:
内部真实性(internal validity) 定义 研究结果与实际研究对象真实情况的符合程度,回 答一个研究本身是否真实或有效。 改善措施 限制研究对象类型 限定研究的环境条件 限定干预措施
☼
所以,对当前吸烟与肺气肿开展横断面研究,计算出来的 现患比 (prevalence ratio)会低估真实的关联
23
南京医科大学康达学院
临床试验中的选择偏倚
☻
临床试验中最大的选择偏倚来源仍是失访
☻
例如,
☺ ☺
某药物不良反应更常发生于病重者 发生不良反应者更易失访
☻
于是:
☺
药物治疗组最后坚持随访的人中病重者少 (即,
33
南京医科大学康达学院
非特异性错误分类
研究真实数据 高脂肪 膳食 心肌梗死 60 低脂肪 膳食 40 心肌梗死 错误分类数据 高脂肪 膳食 48 低脂肪 膳食 52
对照
40
60
对照
32
68
OR= (60×60)/(40×40)=2.3
OR= (48×68)/(52×32)=2.0
特异性错误分类 研究真实数据 高脂肪 膳食 低脂肪 膳食 错误分类数据 高脂肪 膳食 低脂肪 膳食
“说谎偏倚”
(3) 诊断怀疑偏倚(diagnostic suspicion bias) 又称“疑诊偏倚” (4) 暴露怀疑偏倚(exposure suspicion bias) (5) 测量偏倚(detection bias)
(6) 诱导偏倚(inducement bias)
30
南京医科大学康达学院
2 南京医科大学康达学院
5、有人调查喝生水与某病的关联,进行了病例对照研 究。病例组当面询问其喝生水的情况,对照组用电
话询问,结果如下:
病例组 喝生水 不喝生水 400 250 对照组 400 500
2 = 44.16 , OR= 2.00
结论:喝生水和某病有关联。
3 南京医科大学康达学院
讲课提纲
偏倚及其控制
Bias and Control
问题与案例讨论
1、如何认识和评价个体和群体的变异? 2、随机误差和系统误差的区别? 3、有人研究HBsAg携带者孕妇宫内传播HBV的频率, 共检查16例引产死胎,其中4例胎儿肝内HBsAg阳 性,从而得出HBsAg携带者孕妇发生宫内HBV传播 的频率高达25%的结论。 4、有人调查公鸭和母鸭患某病的情况,检查市场上出 售的公鸭3028只,母鸭239只,其患病率分别为4.9% (148/3028)和19.7%(47/239)。因而作者得出某病母 鸭患病率比公鸭高的结论。
0
选择偏倚的大小和方向可表示为:
OR0 OR 选择偏倚 1 OR
若选择偏倚 = 0,即 1 ,则不存在选择偏倚 若选择偏倚 > 0,即 1 ,则存在选择偏倚,此时 OR 0 OR 若选择偏倚 < 0,即 1 ,则存在选择偏倚,此时 OR 0 OR
样本大小
7 南京医科大学康达学院
变异的水平
变异性的水平 个体水平 群体水平 样本水平 变异的来源 个体生物学变异、测量误差 个体间遗传学变异、环境变异、 测量误差 抽样方式、样本大小、测量误差
8
南京医科大学康达学院
源群体
180 ,174,215,305 233,276,146,195
样本A
高胆固醇率
究结果系统地偏离真实值。
2、实质 被选入的研究对象与没有被选者特征上的差
异所造成,造成样本不能代表总体,或两个
样本(或两组研究对象)不是来自同一总体,
后者造成研究之外的因素在两组分布不均衡。
17
南京医科大学康达学院
选择偏倚
☼
☼
概述:威胁内部真实性
选择偏倚 (根据研究设计)
☻ ☻ ☻
☻
描述性研究 病例对照研究 横断面研究 纵向研究 (观察性或实验性)
205,276,195,215,170
= 40% = 20% = 0%
205,188,190,295
170,164,248,162 220,219,228,250
样本B
295,146,220,162,228
样本C
219,164,190,188,233
高胆固醇率 = 25% (>240mg/dL)
源群体与样本高胆固醇率的样本变异性示例
研究该暴露与疾病的联系。
19 南京医科大学康达学院
4、种类
入院率偏倚(admission rate bias ) Berkson’s bias
现患病例或新发病例偏倚(prevalence-incidence bias ) Neyman bias 检出信号偏倚(detection signal bias ) 易感性偏倚(susceptibility bias )
11
南京医科大学康达学院
外部真实性(external validity)
研究结果与推论对象真实情况的符合程度,又称普 遍性(generalizability),回答一个研究能否推广 应用到研究对象以外的人群。
12
南京医科大学康达学院
Other populations
?external validity
18
南京医科大学康达学院
3、来源
( 1 )任意挑拣样本结构 (sampling frame) ,即所谓“典 型 样本”。常见于现况研究和病例对照研究 (2)主观挑拣研究对象 (3)失访或无应答(lost to follow-up or nonrespondent) (4)入院率的影响
(5)根据暴露信息作出诊断的病例,再用这类病例去
a PPV ab PPV ' a' a 'b'
a' Se ' a ' c '
若Se=Se’,PPV=PPV’
ac ab a 'c' a 'b'
32 南京医科大学康达学院
根据各组检查的灵敏度(Se)和特异度(Sp)是否相 同,分为无差异错分偏倚(非特异性错分偏倚)和有差 异错分偏倚(特异性错分偏倚)两种。 非特异性错分 Se=Se’,Sp=Sp’ 但RR≠RR’或OR≠OR’ 特异性错分 Se与Se’或Sp与Sp’至少有一对不等 且RR≠RR’或OR≠OR’ 偏倚方向不确定 偏倚方向趋向 1
1200
1200 2400
4800
4800 9600
6000
6000 12000
21
南京医科大学康达学院
三、某医院中调查全部病人的结果
假定三种疾病的入院率分别为: 皮肤癌=60% 骨折=25%
高血压=40%
则有: 皮肤癌 not 高血压=0.6×4800=2880 骨折 not 高血压=0.25×4800=1200 皮肤癌 with 高血压=0.6×1200+0.4×(1200-720)=912 骨折 with 高血压=0.25×1200+0.4×(1200-300)=660 有高血压 皮肤癌患者 骨折患者 合计 912 660 1572 无高血压 2880 1200 4080 合计 3792 1860 5652
5、测量
以队列研究资料为例,论述错分偏倚产生的条件和类型
31
南京医科大学康达学院
错分不产生偏倚的条件是 RR=RR’, 也即
ac ab a 'c' a 'b'
当暴露组和非暴露组检查的灵敏度(Se)和阳性预测值 (PPV)都相等时,即可满足上述条件。 暴露组 非暴露组
a Se ac
在实际研究需综合考虑研究对象的同质性和异质性 问题。
14
南京医科大学康达学院
三、偏倚 (bias)
概念 在研究设计和实施中出现的系统误差使研究结果系统地 偏离真实值,以及解释结果的片面性,称为偏倚 (bias)。 偏倚的后果 描述性研究 分析性研究 实验性研究 • 样本对总体的推断出现系统误差
• 也可得出虚假和间接联系的假设
disease
exposure
+ -
+ ?internal validity
Reference/target/sou rce population
Study sample
13 南京医科大学康达学院
内部真实性与外部真实性的联系
推论代表性不好,内部真实性可能好,而外部真实 性差。 增加研究对象的同质性(如限制类型如年龄、职业、 体质特征或疾病分型等),可改善内部真实性。 增加研究对象的异质性,可改善外部真实性。
28 南京医科大学康达学院
3、来源
① 检测方法不统一
② 诊断标准不统一
③ 观察条件不统一 ④ 询问方式不统一 ⑤ 研究对象引起,如记忆不准、态度的影响等 ⑥ 综合引起的偏倚,“诱、供、信”造成
29
南京医科大学康达学院
4、种类
(1) 回忆偏倚(recall bias)
(2) 报告偏倚(reporting bias)
27
南京医科大学康达学院
第二节 信息偏倚(information bias)
又称观察偏倚、测量偏倚、衡量偏倚
1、定义 在收集资料的过程中,由于测量暴露或/和
结局的方法缺陷,致使获 得的信息产生系 统误差。
2、本质 通常表现为研究对象的某种特征被错误分类
(misclassification),也即使用的方法偏离了 金标准。在对疾病状态和暴露状态判断时都 有可能发生。