当前位置:文档之家› 偏倚及其控制

偏倚及其控制

偏倚
19
偏倚可以发生于研究设计、实施和分析的各个阶 段
偏倚可以克服,也可以测量 多次重复测量和增加样本含量不能减少系统误差。
20
三、随机误差和系统误差的区别
假设一项研究可以将样本量增至无穷大,能使误差减小到 接近零,则此误差为随机误差。系统误差不受样本量增加 的影响,因此在研究样本无穷大时仍然存在的误差是随机 误差;
适当的重复试验可以减少随机误差,但不能减少系统误差。
21
真实值 样本值
总体
... …. …. …. ………. . .
…..
.. …. .…. .... …..

图4 随机误差与偏倚
22
随机误差 偏倚
临床科学研究中的误差与样本的关系
23
真实性(validity)
定义 研究收集的数据、分析结果和所得结论与客观
系统误差(或称为偏倚)
第二节 误差与研究的真实性
一、随机误差
又称机会(chance),即由于非研究因素影响而 造成的一类不恒定的、随机变化的误差。是不能 完全避免而应该尽量减少的误差。
是流行病学研究中精确性的问题。
15
第二节 误差与研究的真实性
随机误差
• 可以是测量方法本身的随机变异,也可以 是被测定的生物现象的随机变异。
29
第三节 偏倚
一、选择偏倚(selection bias)
定义
在流行病学研究中,由于研究对象的确定、诊断、 选择等方法不正确,使被选入的研究对象与目标人群 的重要特征具有系统的差异,或对比组之间的研究对 象不均衡而产生偏倚。
例如:研究对象采用志愿者,方便样本,或者研究对象的无应答或失访等。
30
第三节 偏倚
以入院病人进行研究时有几种情况可能没有包括:① 抢救不及时而死亡;②距离医院远;③无钱住院;④病情 轻;⑤不同年龄、性别。
34
第三节 偏倚
例:因不同住院率而住院的A、B病患者及其与因素X的关系
疾病 暴露于X者 非暴露于X者 合计 X暴露率(%) OR P
实际人群
A(对照) 200
800
1000
20
队列研究和实验流行病学无此偏倚。
36
第三节 偏倚
例:Framingham心血管疾病研究
血胆固醇与冠心病的关系
胆固醇
队列研究
病例对照研究
水平
发病 未发病 合计 冠心病组 对照组
≥75
85 462 547
38
34
<75
116 1511 1627
113 117
合计
201 1973 2174
151 151
控制方法 分析研究对象的选取具体环节或已选取人群的具体特征。注 意选取对象的代表性。 分析研究对象的选取是否同暴露或处理因素有关。
32
第三节 偏倚
常见选择偏倚
入院率偏倚 现患-新发病例偏倚 无应答偏倚 志愿者偏倚
33
第三节 偏倚
(一)、入院率偏倚(admission rate bias)
又称伯克森偏倚(Berkson’s bias),是指利用医院就诊或 住院病人作为研究对象时,由于入院率或就诊机会不同而 导致的偏倚。
描述性研究的选择偏倚
主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些特定群
体(志愿者、因特网利用者等)造成的外部效度(外推) 受限问题。 控制方法 尽量采用随机抽样,避免样本选取的偏向 对特定群体的结果在外推上要谨慎等
31
第三节 偏倚
分析性研究的选择偏倚
主要体现 研究对象进入、排除、不参与或失访等与研究暴露 或处理因素存在关联,由此增大或减少暴露与疾病、处理与 效应的关联,导致效应估计的偏倚。
11
第一节 研究结果的变异性
• 图2,研究A和研究B中膳食改良组五年内发生心梗死 的风险为9%,降胆固醇药物组为6%
• A样本较小(200人),两组效应指标(心肌梗死风 险)的95%可信限较大,从而发生重叠,统计检验无 显著性差异
• 研究B样本较大(2000人),两组效应指标的95%可 信限较小,从而未发生重叠,统计检验有显著性差异
• 一般而言,研究样本越大,效应估计值的抽样误差越 小(95%可信限越小),统计检验能发现的两组间效 应差值越小
12
第二节 误差与研究的真实性
第二节 误差与研究的真实性
误差(error)
测量值与真实值的差异,研究结果与客观实际 存在不符合的地方,就是研究误差
危害:影响结果真实性,导致错误结论
随机误差 误差
高胆固醇率 = 25% (>240mg/dL)
样本A
高胆固醇率
305,276,195,215,170 = 40%
样本B
295,146,220,162,228 =20%
样本C
219,164,190,188,233 =0%
图1 源群体与样本高胆固醇率的样本变异性示例
源群体高胆固醇率为25%,样本A为40%,样本B 为20%,样本C为0%。如果增大样本含量,样本的变 异性会减少,样本的高胆固醇率对群体的代表性会增 大
10
第一节 研究结果的变异性
研究 A(研究对象 200 人,随机分配到两组) 膳食改良组
降胆固醇药物组
0
5
10
15
五年内发生
心肌梗死风险(%)
研究 B(研究对象 2000 人,随机分配到两组)
膳食改良组
降胆固醇药物组
0
5
10
15
五年内发生
心肌梗死风险(%)
图2 膳食与药物预防心机梗死的样本变异性示例
偏倚及其控制
(Biases and Their Control)
山西医科大学流行病学教研室
第一节 研究结果的变异性 第二节 误差与研究的真实性 第三节 偏 倚* 第四节 交互作用
2
研究的解说涉及到研究的真实性与因 果推断的问题。研究的真实性直接关系到 是否获得正确的结论,而真实性需要通过 变异性估计来确定。
实际的符合程度。或能够获得正确结论的程度。
两个方面 内部真实性 外部真实性
24
内部真实性(internal validity)
定义 研究结果与实际研究对象真实情况的符合程度,
回答一个研究本身是否真实或有效。研究结果能 准确反映目标人群真实状况的程度 改善措施 限制研究对象类型 限定研究的环境条件 限定干预措施
(四)、检出征候偏倚(detection signal bias)
亦称为揭露伪装偏倚(unmasking bias),指某因素与某
疾病在病因学上虽无关联,但由于该因素的存在而引起该疾 病症状或体征的出现,从而使患者及早就医,接受多种检查, 导致该人群较高的检出率,以致得出该因素与该病相关联的 错误结论。
41
第三节 偏倚
• 妇女服用复方雌激素与子宫内膜癌关系 • 使用雌激素——阴道出血,就诊后检出早期子宫内膜癌。 • 因为那些阴道出血的病人求医和接受检查的机会多些,能
够早期发现子宫内膜癌,而那些虽患子宫内膜癌但无症状 且不服雌激素的早期病例,因未诊断出来而被排除。
1
1
B(病例) 200
800
1000
20
合计
400
1600
2000
20
住院率(对照A=50%;病例B=20%;暴露于因素X者40%)
A(对照) B(病例)
合计
140 104 244
200×0.5+ 400
100 ×0.4
160
200×0.2+
160 ×0.4 560
800 ×0.5 540
800 ×0.2 264 804
3
第一节 研究结果的变异性
概述 个体水平的变异性 群体水平的变异性 样本水平的变异性
4
第一节 研究结果的变异性
一 、概 述
变异性(variability) 研究结果包括描述性和分析性数据(指标)的
变动或波动。
变异性水平 个体 群体
样本(研究)
变异的来源
个体生物学变异,测量误差
个体间遗传学变异,环境变异,测量 误差 抽样方式,样本大小,测量误差
17
减少随机误差的措施
© 多次重复和/或增加研究的样本量。 © 改善测量方法和工具。 © 统一调查的时间和/或被调查者的生理状态。 © 改善研究设计和抽样方案。
18
二、系统误差
人为造成的错误,是由于研究设计、 实施和分析不正确造成的测量值与真实值 之间的差异。
如果误差向量的方向一致或基本一致 时,即所获得的结果系统地偏离真实值。这 种误差称为系统误差。
8
第一节 研究结果的变异性
四、样本水平的变异性
• 定义
– 不同样本的研究所得结果的差异性
• 来源
– 抽样方式 – 样本大小 – 测量误差
• 分类
– 描述性结果的样本变异性(图1) – 分析性结果的样本变异性(图2)
9
第一节 研究结果的变异性
源群体
180 ,174,215,305 233,276,146,195 205,188,190,295 170,164,248,162 220,219,228,250
• 利用统计学技术可估计随机误差的大小, 但随机误差无法消除。
16
第二节 误差与研究的真实性
随机误差的两个特点
• 样本的观察值都在平均值上下分布,从许多无偏 倚样本中得到的观察值均数,假如数量较大,总 是趋向于接近总体值;
• 随机误差的范围可以用可信区间估计,当保持随 机方法而加大样本时,样本均值逐渐向总体均值 接近。
25
外部真实性(external validity)
相关主题