当前位置:文档之家› 流行病学研究中的常见偏倚

流行病学研究中的常见偏倚

bias)
一般情况下,志愿者与非志愿者在关心 健康、注意饮食习惯、禁烟、禁酒及体 育锻炼等方面可能存在系统的差别,因 而,志愿者被入选为观察对象,而非志 愿者落选,这样的研究结果往往有选择 偏倚。例如,一项以体育锻炼预防冠心 病的研究,干预组都是志愿者,而将非 志愿者作对照,以比较该项措施的效 果,这样就可能会得出不正确的结论。
合计
组)
组)
1200
1200
2400
4800
4800
9600
OR=1,χ2检验差异无显著性,说明A病与X因素无关系。
假设A病住院率为25%,B病住院率为60%,具 有X因素也有一定的入院率为40%。现就上述 不同的入院率计算住院人数:
A病无X因素住院人数=4800×0.25=1200人
A病有X因素住院人数=1200×0.25+(1200 -300)×0.4=660人
7
72
110
117
117
9.8
妇科
暴露
非暴露
59
42
89
108
148
148
1.7
1978年,Horwitz指出,这一结论是由检 出征候偏倚所致,两者之间的高度关联 是虚假的。因为在人群中有一定量的无 症状的子宫内膜癌早期病人,她们若不 服用雌激素,子宫不致出血,因而不去 医院就诊,而不能被发现。
4. 志愿者偏倚(volunteer
2、尽量采用多种对照
理想的是以人群中全体病例和非病例(或其 有代表性的样本)作为研究对象。如以医院 病例为研究对象,宜在多个医院选择对象, 且最好有2个对照组,其中一个对照组来自 社区一般人群,在队列研究中,最好也应设 多种对照,以减少选择偏倚对结果的影响。
3、严格掌握研究对象入选与排除的标准
使研究对象能较好地代表其相应的总体。如 病例对照,一般可规定病例的入选原则为新 发的确诊病例,以避免Neyman偏倚。在实验 性研究中,应严格按照随机分配的原则,将 研究对象分组,使两组除所观察因素外应具 有均衡性、可比性。应避免将志愿者分为一 组,非志愿者分为另一组,病情轻者分在一 组,病情重者分在另一组等情况的发生。
AD OR =
BC
表6-6 实际抽样人群疾病与暴露分布
暴露
非暴露
病例
Ao
Bo
非病例
Co
Do
样本比数比: OR
= Ao D o BoC o
选择概率为:
α = Ao A
β = Bo B
γ = Co
C
δ = Do D
根据选择概率:
OR
o=
OR
αδ βγ
OR 选择偏倚 =
o − OR

αδ −1
OR
βγ
αδ
流行病学研究中的常见偏倚 及其控制
上海交通大学公共卫生学院 施榕
偏倚(bias)
指观察值与真值之间的偏离,是一种随机误 差以外误差的误差,属系统误差 (systemic error)它是由某些较为恒定的 不能准确测量的因素所造成。偏倚可发生在 流行病学研究的设计、实施分析等各个阶 段,如选择对象中以志愿者代替随机样本, 使调查对象不能代表总体。重复抽样或加大 样本含量并不能使这种误差减少或消失。流 行病学研究中常见的偏倚主要有三大类,即 选择偏倚、信息偏倚、混杂偏倚。 。
RR
2.4
1.16
进一步调查发现,患冠心病病人在被诊 断为该病后,其后来的生活习惯或嗜好 发生改变,如开始戒烟、多食低胆固醇 食物、进行体育锻炼,从而使血中胆固 醇水平降低,因此病例对照研究的结论
存在明显的差异。
3.检出征候群偏倚(detection signal bias)
检出征候群偏倚是指某因素与某疾病在 病因学上虽无关系,但由于该因素的存 在会引起该病的临床症状或体征的出 现,从而使患者及早就医,接受多种检 查,导致该人群有较高的检出率,致使 过高地估计该因素与该疾病的关联 。
表6-3 费明汉地区男性居民血胆固醇水平与冠心病关系
定群研究
病例对照研究
检查时新 未发病
检查时现患 未发病
合计
合计
病人总数 人数
病人总数 人数
胆固醇≥
85
462 547
38
P75
34 72
胆 固 醇 <P75 116
1511 1627
113
117 230
合计
201 1973 2174
151
151 302
第一节 选择偏倚及控制
一、选择偏倚概念及类型
选择偏倚(selection bias)是由于选择研究 对象的方法有问题,使入选者与未入选 者在某些特征上存在着系统差异,从而 导致研究结果偏离真实情况。在各类流 行病学研究中均可发生选择偏倚,以病 例对照研究中较为常见,如入院率偏倚、 现患病例-新病例偏倚、检出症候群偏倚 等。
二、选择偏倚的测量与防制
(一)、选择偏倚的测量
选择偏倚在理论上可以通过总人群与实 际抽样人群疾病与暴露分布情况进行测 量。下面以病例对照研究为例,总人群 与实际抽样人群中疾病与暴露因素的分 布分别如表6-5和表6-6所示:
表6-5 总人群疾病与暴露分布
暴露
非暴露
病例
A
B
非病例
C
D
总人群比数比:
1572 × 4080 ×1860 × 3792
P<0.01,
OR = ad = 660 × 2880 = 1 . 74 bc 912 × 1200
上述结果表明人群中A病与X因素本无关联,而以医院病例 作为样本所得观察结果则是有关联的。
2.现患病例-新病例偏倚 (prevalence-incidence bias)
αδ
偏倚= -1=0.74
βγ
(二)选择偏倚的防制
1、正确的研究设计
首先研究者对整个研究可能会产生的各种选 择偏倚有充分的了解。在设计中,应注意使 被比较的各组有同等的概率受到调查。应考 虑可能出现的各种偏倚,以及会在那些环节 出现,只有在设计时考虑周全,并采取相应 措施,在各个环节中阻断偏倚产生的可能 性,才能防止或减少其发生。
若 偏倚=0 即 =1,则不存在选择偏倚
βγ
偏倚>0,
αδ

>1,
则存在正向选择偏倚
βγ
偏倚<0,
αδ

<1, 则存在负向选择偏倚
βγ
现以前述入院率偏倚为例,
α=660/1200=0.55 β=1200/4800=0.25 γ=912/1200=0.76 δ=2880/4800=0.6
αδ = 0.55× 0.6 = 1.74 βγ 0.25× 0.76
3.诊断怀疑偏倚(diagnostic suspicion bias)
由于研究者事先了解研究对象对研究因 素的暴露情况,于是带着 “先入为主”的 倾向性,怀疑其患某病或在主观上倾向 出现某种阳性结果。如对暴露组或实验 组进行非常仔细地检查,而对非暴露组 或对照组则不然,从而使研究结果出现 偏差,由此而产生诊断怀疑偏倚,此类 偏倚多见于队列研究和临床试验。
在病例对照研究,调查时选择的病例往 往是存活的现患病例,无法对那些因患 病已死亡的病例或轻型、非典型或已痊 愈的病例进行调查,而队列研究中常采 用新发生的病例,因而病例对照研究得 出的结论与队列研究的结果可能发生差 异,此即现患病例-新病例偏倚,也称为 奈曼偏倚(Neyman bias)。
例如,Friedman等人在美国弗明汉地区 对心血管系统疾病的研究中发现:男性 居民在队列研究中,具有高胆固醇水平 者,患冠心病的 RR值为2.40,而另一项 病例对照研究中,病例组与对照组却无 明显差异,OR=1.16(表)。
第二节 信息偏倚及控制
一、信息偏倚的概念及类型
信息偏倚(information bias)是指在研究的实施阶 段中从研究对象获取研究所需的信息时产生的系统 误差,其原因是由于诊断疾病、测量暴露或结局的 方法有问题,导致被比较各组间收集的信息有差异 而引入的误差。
各种类型的流行病学研究中均可产生信息偏倚,病 例对照研究中常见的信息偏倚有回忆偏倚、报告偏 倚、调查者偏倚、诱导偏倚等。错误分类偏倚则在 病例对照研究和队列研究中都可产生。
1.回忆偏倚(recall bias)
指比较组间在回忆过去的暴露或既往史时,其 完整性与准确性存在系统误差而引起的偏倚。 回忆偏倚在病例对照研究中最常见,主要原因 有:
(1).研究对象对调查的内容关心程度不同,一 般情况下,病例组患者对调查的事件回忆认真程度 高于对照人群,因而导致两组对象在回忆以往事件 的准确性存在差异。
如Seltze等报道,以函访调查人群吸烟 状况时发现,85%的非吸烟者在一个月内 回函应答了调查内容,但在吸烟者中, 应答率仅占67%,这样对男性吸烟的估计 是明显低估的。
6. 失访偏倚(loss to follow up bias)
失访也是无应答的一种表现,只是它主 要发生在队列及实验性研究中。在随访 研究过程中,研究对象未能按计划被随 访,它是此类研究选择偏倚的主要原因 之一。
(2).调查的事件或因素发生的频率较低,未给 研究对象留下深刻印象而遗忘。
(3).调查事件是很久以前发生的事情,研究对 象记忆不清。
2.报告偏倚(reporting bias)
被调查者有意隐瞒真实情况,夸大或缩 小某些信息而导致研究结果产生偏倚, 故亦称说谎偏倚。常见于敏感问题,如 未成年人的吸烟史、冶游史。例如,有 些人有冶游史,可能会难于陈述实情。 而对于一些职业危害进行调查,研究对 象因涉及劳保福利等原因可能会夸大某 些暴露信息。
失访一般有两种情况,一种是由于观察期限 短于原规定的观察危险期,一般与所观察的 暴露因素或结果无关,且经过统计学处理能 把他们当作截尾数据(censored data)处 理。虽观察不到他们发生某事件的概率,但 与留在观察组中的非失访者是相同的,一般 较少引起偏倚。
相关主题