偏倚及其控制
亦称 混杂因子、混杂变量、 外来因素(extraneous factor)
是指与研究的因素和疾病均有关, 若在比较的人群 组中分布不均衡,可以歪曲(缩小或夸大)研究 因素与疾病之间真实联系的因素。
混杂因素的特点
✓ 是所研究疾病的危险因素; ✓ 与所研究的因素有关; ✓ 不是研究因素与研究疾病因果链上的中间变量。
某病早期 尚无症状
存在 某因素
出现 该病相关症状
或体征
该人群 及早 该病检出率 就医 高于
一般人群
得出该因素与该疾病相关联
绝经期服用雌激素与子宫内膜癌的病例对照研究
选自妇科 子宫出血病人
子宫内膜癌 人群中
病例
正常对照
服用雌激素与 子宫内膜癌
高度关联
检出 症候 偏倚
选自妇科 子宫出血病人
病例 对照
服用雌激素与子宫内膜癌
(prevalence-incidence bias)
也称奈曼偏倚(Neyman bias)。
以现患病例为对象进行研究,与以新病例为对象 进行研究时相比,因研究对象的特征差异所致的 偏倚。
表4 美国Framingham地区男性居民 血胆固醇水平与冠心病关联的研究
胆固醇 队列研究(到第6次检查) 病例对照研究(到第6次检查) 百分位 冠心病 非冠心病 合计 冠心病 非冠心病 合计
于所比较各组入院率的不同而导致的偏倚。
举例 :社区人群中——
A病和B病各有1000人 A病和B病患者中各有100人暴露于因素X
表1 社区人群中疾病B与X暴露的关系
X暴露 X非暴露 总人数 X暴露率(%)
病例(B) 100 900 1000
10
对照(A) 100 900 1000
10
OR=(100×900) / (100×900)=1
中毒性 休克综
合征 因而夸大了内用卫生棉条与中毒性休克综合征间的关系。
➢测量偏倚(detection bias)
研究者对研究所需数据进行测量时所产生 的系统 误差。
例如,实验仪器、设备测量不准确, 试剂不符合要求, 测量方法的标准或程序不统一, 检测人员的操作不规范, 调查表设计不合理, 记录不完整, 调查人员的调查方式不正确等。
●
●●●● ●
● ● ● ●●
●●
●
●●
●
随机误差
系统误差
80
90 舒张压(mmHg)
图1 动脉内插管法和血压计法测量舒张压值的分布
偏倚及其种类
➢偏倚(Bias)
指随机误差以外的,可导致研究结果与真实情况差异的系
统误差,有固定方向,可发生于研究设计、实施、数据处 理和分析的各个环节。
•方向
假设 真实效应 RR(θ), 测量效应 RR ( θˆ )
(岁) 劳动强度 Ni
ai
ai / Ni
35~44 轻、中度 5900
3
5.1
重度
8300
4
4.8
45~54 轻、中度 17600
62
35.2
重度 11000
20
18.2
55~64 轻、中度 23700
183
77.2
重度
7400
34
45.9
65~74 轻、中度 17800
284
159.6
重度
1000
选择偏倚的控制
➢掌握发生环节 ➢严格选择标准 ➢研究对象的合作 ➢采用多种对照
第一节 概 述 第二节 选择偏倚 第三节 信息偏倚 第四节 混杂偏倚
第三节 信息偏倚
定义 种类 控制
定义
➢信息偏倚 (information bias)
又称 观察偏倚 (observational bias) 指在研究实施过程中,获取研究所需信息时产生 的系统误差。
表5 类风湿关节炎家族史调查、分析结果
关节炎
病例(%) 对照(%) OR
A
双亲均无 双亲之一有 双亲均有 合计
B 双亲均无 双亲之一有 双亲均有 合计
3 ( 15.8 ) 10 ( 52.6 ) 6 ( 31.6 ) 19
11 ( 27.5 ) 23 ( 57.5 ) 6 ( 15.0 ) 40
111 ( 55.2 )
➢暴露怀疑偏倚(exposure suspicion bias)
研究者事先了解研究对象的患病情况或某结局,可 能会对其采取与对照组不可比的方法,探寻认为与某 病或某结局有关的因素,由此而导致的系统误差。
(了解病例与对照相关因素暴露情况,方法不同)
➢诊断怀疑偏倚(diagnostic suspicion bias)
RR( θ ) = 2.0
RR ( θ ) = 0.5
正偏倚 负偏倚
RR(θˆ) = 3.0 RR ( θˆ ) =1.5
RR ( θˆ) = 0.2 RR ( θˆ ) = 0.8
颠倒偏倚 RR ( θˆ) =0.6
RR ( θˆ) = 1.4
➢ 分类
选择偏倚 信息偏倚 混杂偏倚
selection bias information bias counfounding bias
➢错误分类 (misclassification)
• 无差异错误分类(non-differential misclassification) • 有差异错误分类(differential misclassification)
种类
➢ 回忆偏倚(recall bias)
指研究对象在回忆以往研究因素的暴露 情况等信息时,由于准确性或完整性上 的差异而导致的系统误差。
X暴露 X非暴露 合计 X暴露率(%)
病例(B) 55
90
145
37.9
对照(A) 80
540
620
12.9
合计 135
630
765
17.6
(OR=4.13 χ2=50.65 P<0.01)
由此可见,由于研究对象入院率的不同, B病与因素X之间出现了强的统计学联系。
表3
➢ 现患病例-新发病例偏倚
1.0
74 ( 36.8 )
5.0
16 ( 8.0 ) 13.9
201
20 ( 50.0 ) 1.0 17 ( 42.5 ) 2.5 3 ( 7.5 ) 3.6 40
A:以无该病的一般人群为对 照
(Schull and Cobb,1969)
➢报告偏倚(reporting bias)
在收集研究信息时,由于某些原因,研究对象有意 夸大或缩小某些信息而导致的系统误差。
关联强度明显减小
➢无应答偏倚(non-response bias)
无应答者是指调查对象中那些不回答调查研究工 作所提出的问题的人。
在特定研究样本中,无应答者的患病状况或者对 某些研究因素的暴露上与应答者有区别,如无应 答者超过一定的比例,将使研究结果产生偏倚,称 为无应答偏倚。
➢易感性偏倚(susceptibility bias)
X暴露与疾病B无关联
设: 患B病的入院率为10%,A病的入院率为60%, 暴露于X者的入院率为50%,这样实际住院人数应 1.为B病:有X暴露的100人中,
(1)因B病入院率为10%,其住院人数为10人 (2)因暴露X入院率为50%,余下的90人中,45人住院
合计: 住院人数55人 2.B病无X暴露的900人中,
➢混杂偏倚的程度与方向
混杂偏倚 = (cRR-aRR(f)) / aRR(f) 若得值=0,为无混杂。 当得值≠0时,
若为正值,为正混杂; 若为负值,为负混杂。 值的大小为混杂的程度。
➢测量举例
表8 男性体力劳动强度与冠心病死亡关系的队列研究
年龄组 体力 观察人年数 死亡人数 死亡率(1/1万人年)
➢信息偏倚的控制
严格信息标准 调查表设计,项目检测方法等 盲法收集信息 对于不同比较组 采用客观指标 现场测量,实验室分析,
查阅健康档案
调查技术的应用 敏感问题调查法 统计学处理 根据信息重测校正
第一节 概 述 第二节 选择偏倚 第三节 信息偏倚 第四节 混杂偏倚
第四节 混杂偏倚
定义 测量 控制
系统误差(偏倚) 设计、分析、测量技术 系统误差 加大样本不能缩小系统误差 系统误差大小无法估计 歪曲真实联系
以测量血压为例说明随机误差与系统误差之间的关系。
用动脉内插管测知的 舒张压真实值
用血压计测知的 舒张压读数
观 察 人 数
●
●●
●●
●
●●●● ●
● ● ● ●●
●●
●
●●
●
随机误差
●
●●
●●
吸烟
肺癌
年龄
比较组的年龄分布 不均衡时,年龄成 为混杂因素
测量
➢以效应估计值RR为例:
若cRR=aRR(f) f 无混杂作用, cRR不存在f 的混杂偏倚。
若cRR≠aRR(f) f 有混杂作用, cRR存在f 的混杂偏倚。 -若cRR>aRR(f) 为正混杂(positive confounding) -若cRR<aRR(f) 为负混杂(negative confounding)
因B病入院率为10%,住院人数90人 3.A病有X暴露的100人中, (1)因A病入院率为60%,其住院人数为60人 (2)因暴露X入院率为50%,余下的40人中,20人住院
合计: 住院人数80人 4.A病无X暴露的900人中,
因A病入院率为60%,住院人数540人
表2 住院的A、B病患者及其与X暴露的关系
>75
85
462 547
38
34
72
≤75 116
1511 1627
113
117 230