当前位置：文档之家› 流行病学研究中的常见偏倚

流行病学研究中的常见偏倚

bias）
一般情况下，志愿者与非志愿者在关心健康、注意饮食习惯、禁烟、禁酒及体育锻炼等方面可能存在系统的差别，因而，志愿者被入选为观察对象，而非志愿者落选，这样的研究结果往往有选择偏倚。例如，一项以体育锻炼预防冠心病的研究，干预组都是志愿者，而将非志愿者作对照，以比较该项措施的效果，这样就可能会得出不正确的结论。
合计
组)
组)
1200
1200
2400
4800
4800
9600
OR＝1，χ2检验差异无显著性，说明A病与X因素无关系。
假设A病住院率为25％，B病住院率为60％，具有X因素也有一定的入院率为40％。现就上述不同的入院率计算住院人数：
A病无X因素住院人数＝4800×0.25＝1200人
A病有X因素住院人数＝1200×0.25＋(1200 －300)×0.4＝660人
7
72
110
117
117
9.8
妇科
暴露
非暴露
59
42
89
108
148
148
1.7
1978年，Horwitz指出，这一结论是由检出征候偏倚所致，两者之间的高度关联是虚假的。因为在人群中有一定量的无症状的子宫内膜癌早期病人，她们若不服用雌激素，子宫不致出血，因而不去医院就诊，而不能被发现。
4. 志愿者偏倚（volunteer
2、尽量采用多种对照
理想的是以人群中全体病例和非病例(或其有代表性的样本)作为研究对象。如以医院病例为研究对象，宜在多个医院选择对象，且最好有2个对照组，其中一个对照组来自社区一般人群，在队列研究中，最好也应设多种对照，以减少选择偏倚对结果的影响。
3、严格掌握研究对象入选与排除的标准
使研究对象能较好地代表其相应的总体。如病例对照，一般可规定病例的入选原则为新发的确诊病例，以避免Neyman偏倚。在实验性研究中，应严格按照随机分配的原则，将研究对象分组，使两组除所观察因素外应具有均衡性、可比性。应避免将志愿者分为一组，非志愿者分为另一组，病情轻者分在一组，病情重者分在另一组等情况的发生。
AD OR =
BC
表6-6 实际抽样人群疾病与暴露分布
暴露
非暴露
病例
Ao
Bo
非病例
Co
Do
样本比数比： OR
= Ao D o BoC o
选择概率为：
α = Ao A
β = Bo B
γ = Co
C
δ = Do D
根据选择概率：
OR
o=
OR
αδ βγ
OR 选择偏倚 =
o − OR
或
αδ −1
OR
βγ
αδ
流行病学研究中的常见偏倚及其控制
上海交通大学公共卫生学院施榕
偏倚(bias)
指观察值与真值之间的偏离，是一种随机误差以外误差的误差，属系统误差（systemic error）它是由某些较为恒定的不能准确测量的因素所造成。偏倚可发生在流行病学研究的设计、实施分析等各个阶段，如选择对象中以志愿者代替随机样本，使调查对象不能代表总体。重复抽样或加大样本含量并不能使这种误差减少或消失。流行病学研究中常见的偏倚主要有三大类，即选择偏倚、信息偏倚、混杂偏倚。。
RR
2.4
1.16
进一步调查发现，患冠心病病人在被诊断为该病后，其后来的生活习惯或嗜好发生改变，如开始戒烟、多食低胆固醇食物、进行体育锻炼，从而使血中胆固醇水平降低，因此病例对照研究的结论
存在明显的差异。
3.检出征候群偏倚（detection signal bias）
检出征候群偏倚是指某因素与某疾病在病因学上虽无关系，但由于该因素的存在会引起该病的临床症状或体征的出现，从而使患者及早就医，接受多种检查，导致该人群有较高的检出率，致使过高地估计该因素与该疾病的关联。
表6-3 费明汉地区男性居民血胆固醇水平与冠心病关系
定群研究
病例对照研究
检查时新未发病
检查时现患未发病
合计
合计
病人总数人数
病人总数人数
胆固醇≥
85
462 547
38
P75
34 72
胆固醇 <P75 116
1511 1627
113
117 230
合计
201 1973 2174
151
151 302
第一节选择偏倚及控制
一、选择偏倚概念及类型
选择偏倚(selection bias)是由于选择研究对象的方法有问题，使入选者与未入选者在某些特征上存在着系统差异，从而导致研究结果偏离真实情况。在各类流行病学研究中均可发生选择偏倚，以病例对照研究中较为常见，如入院率偏倚、现患病例-新病例偏倚、检出症候群偏倚等。
二、选择偏倚的测量与防制
（一）、选择偏倚的测量
选择偏倚在理论上可以通过总人群与实际抽样人群疾病与暴露分布情况进行测量。下面以病例对照研究为例，总人群与实际抽样人群中疾病与暴露因素的分布分别如表6-5和表6-6所示：
表6-5 总人群疾病与暴露分布
暴露
非暴露
病例
A
B
非病例
C
D
总人群比数比：
1572 × 4080 ×1860 × 3792
P<0.01，
OR ＝ ad ＝ 660 × 2880 ＝ 1 . 74 bc 912 × 1200
上述结果表明人群中A病与X因素本无关联，而以医院病例作为样本所得观察结果则是有关联的。
2.现患病例-新病例偏倚（prevalence-incidence bias）
αδ
偏倚= -1=0.74
βγ
（二）选择偏倚的防制
1、正确的研究设计
首先研究者对整个研究可能会产生的各种选择偏倚有充分的了解。在设计中，应注意使被比较的各组有同等的概率受到调查。应考虑可能出现的各种偏倚，以及会在那些环节出现，只有在设计时考虑周全，并采取相应措施，在各个环节中阻断偏倚产生的可能性，才能防止或减少其发生。
若偏倚=0 即 =1，则不存在选择偏倚
βγ
偏倚>0，
αδ
即
>1，
则存在正向选择偏倚
βγ
偏倚<0，
αδ
即
<1，则存在负向选择偏倚
βγ
现以前述入院率偏倚为例，
α=660/1200=0.55 β=1200/4800=0.25 γ=912/1200=0.76 δ=2880/4800=0.6
αδ = 0.55× 0.6 = 1.74 βγ 0.25× 0.76
3．诊断怀疑偏倚（diagnostic suspicion bias）
由于研究者事先了解研究对象对研究因素的暴露情况，于是带着 “先入为主”的倾向性，怀疑其患某病或在主观上倾向出现某种阳性结果。如对暴露组或实验组进行非常仔细地检查，而对非暴露组或对照组则不然，从而使研究结果出现偏差，由此而产生诊断怀疑偏倚，此类偏倚多见于队列研究和临床试验。
在病例对照研究，调查时选择的病例往往是存活的现患病例，无法对那些因患病已死亡的病例或轻型、非典型或已痊愈的病例进行调查，而队列研究中常采用新发生的病例，因而病例对照研究得出的结论与队列研究的结果可能发生差异，此即现患病例-新病例偏倚，也称为奈曼偏倚（Neyman bias）。
例如，Friedman等人在美国弗明汉地区对心血管系统疾病的研究中发现：男性居民在队列研究中，具有高胆固醇水平者，患冠心病的 RR值为2.40，而另一项病例对照研究中，病例组与对照组却无明显差异，OR=1.16（表）。
第二节信息偏倚及控制
一、信息偏倚的概念及类型
信息偏倚(information bias)是指在研究的实施阶段中从研究对象获取研究所需的信息时产生的系统误差，其原因是由于诊断疾病、测量暴露或结局的方法有问题，导致被比较各组间收集的信息有差异而引入的误差。
各种类型的流行病学研究中均可产生信息偏倚，病例对照研究中常见的信息偏倚有回忆偏倚、报告偏倚、调查者偏倚、诱导偏倚等。错误分类偏倚则在病例对照研究和队列研究中都可产生。
1．回忆偏倚(recall bias)
指比较组间在回忆过去的暴露或既往史时，其完整性与准确性存在系统误差而引起的偏倚。回忆偏倚在病例对照研究中最常见，主要原因有：
（1）．研究对象对调查的内容关心程度不同，一般情况下，病例组患者对调查的事件回忆认真程度高于对照人群，因而导致两组对象在回忆以往事件的准确性存在差异。
如Seltze等报道，以函访调查人群吸烟状况时发现，85%的非吸烟者在一个月内回函应答了调查内容，但在吸烟者中，应答率仅占67%，这样对男性吸烟的估计是明显低估的。
6. 失访偏倚（loss to follow up bias）
失访也是无应答的一种表现，只是它主要发生在队列及实验性研究中。在随访研究过程中，研究对象未能按计划被随访，它是此类研究选择偏倚的主要原因之一。
（2）．调查的事件或因素发生的频率较低，未给研究对象留下深刻印象而遗忘。
（3）．调查事件是很久以前发生的事情，研究对象记忆不清。
2．报告偏倚(reporting bias)
被调查者有意隐瞒真实情况，夸大或缩小某些信息而导致研究结果产生偏倚，故亦称说谎偏倚。常见于敏感问题，如未成年人的吸烟史、冶游史。例如，有些人有冶游史，可能会难于陈述实情。而对于一些职业危害进行调查，研究对象因涉及劳保福利等原因可能会夸大某些暴露信息。
失访一般有两种情况，一种是由于观察期限短于原规定的观察危险期，一般与所观察的暴露因素或结果无关，且经过统计学处理能把他们当作截尾数据（censored data）处理。虽观察不到他们发生某事件的概率，但与留在观察组中的非失访者是相同的，一般较少引起偏倚。

e商务文档

流行病学研究中的常见偏倚

相关文档推荐：