当前位置:文档之家› 病例对照研究

病例对照研究

第六章 病例对照研究 主要内容  基本原理  研究类型  一般实施步骤  资料的整理与分析  常见偏倚及其控制  优点与局限性 第一节 概述 1. 病例对照研究 Case-control Study,也称为回顾性研究 retrospective study 一、 病例对照研究的概念  病例对照研究选择一组所研究疾病(或临床事件)的患者组成病例组,以未患有该疾病者(或未发生某种临床事件者)为对照组,回顾性调查过去某个或某些因素的暴露史,通过比较两组暴露史的有无或暴露的剂量,研究暴露因素与所研究疾病(或临床事件)有无关联及关联强度  一种常用于广泛探索或初步验证病因假设的分析性流行病学研究方法 二、病例对照研究的基本原理 三、病例对照研究的特点  观察性研究,回顾性收集研究对象的暴露情况(人群是自然生病的,无人为干预)  必须设立对照组(可比,未患某病)  时间顺序:从“果”→“因”  一般不能明确因果的时间顺序,但可为前瞻性研究提供线索和方向 思考:病例对照研究和历史性队列研究的异同点? 两种研究设计本质的不同是分组依据不同、暴露和疾病关系的分析思路不同。病例对照研究按是否患病分组,回顾性调查过去暴露情况;历史性队列研究尽管是“回顾”过去的暴露和疾病发生资料,但分组是按暴露与否,前瞻性追踪结局-疾病发生与否。前者是回归性的研究设计,后者是前瞻性的研究设计(从暴露和疾病关系的分析思路来说),只不过是过去的资料,有点“回顾”成分而已,容易使人混淆两者。 适用情况  疾病比较罕见,如恶性肿瘤的研究  潜伏期较长的慢性病,如心脑血管研究  深入检验病因假说  对疾病的发生还没有深入了解,可初步探讨病因  研究人群流动性特别大,不适合队列研究 第二节 研究类型 一、 非匹配病例对照研究 病例和对照之间的关系不作限制和规定 二、匹配病例对照研究 1、成组匹配 category matching 或称频数匹配 frequency matching 某些特征或因素在不同组的比例一致 2、个体匹配 individual matching 以个体为单位,对某些特征或因素进行匹配(最多做到1:4) 1)病例与对照匹配的因素 ◆混杂因素 confounding factor(已知+可疑)(所谓混杂因素就是要与暴露因素相关且与疾病结局相关)(比如研究吸烟与肺癌,性别就是一个混杂因素) 常见因素:年龄+性别  不能匹配的因素 - 研究因素与疾病因果链中的中间变量(比如:高血脂是脑卒中的一个中间变量) - 只与可疑暴露有关,而与疾病无关的变量 如是否服用避孕药与宗教信仰有关,但宗教信仰与所研究的疾病无关,则不应作为匹配因素 2)病例与对照匹配的目的(◎优点)  提高研究效率 研究效率=2R/(R+1)  控制混杂因素的干扰作用 3)匹配带来的问题  增加工作难度(费用、时间)  限制样本量  匹配因素将无法再进行分析  匹配过头 overmatching把与结局变量关联性很强的独立变量作为匹配条件,从而低估真实病因的作用,称为匹配过头 - 损害统计效率 - 损害真实性 - 损害费用效益 第三节 一般实施步骤 基本步骤  复习文献,提出假设  明确适宜的研究类型  选择病例及适宜的对照  确定样本量  选定研究因素,获取相关资料  数据整理、分析和结果解释 一、 提出假设 二、明确适宜的研究类型 是否进行匹配  根据研究目的 - 广泛探索病因,可采用不匹配或频数匹配 - 深入探索或验证病因假说,应采用匹配形式  根据病例数量 - 少 → 匹配; 多 → 匹配 或 成组 - 匹配可使用较小的样本获得较高的检验效率 三、病例与对照的来源与选择 ※病例的选择 1、选择原则 选择的病例能够代表目标人群中病例的总体 2、选择标准 - 诊断可靠,使用金标准 - 自订标准:宽严适度(假阳性、假阴性) - 为了控制非研究因素的干扰,可对暴露情况作出规定 3、病例的类型 最好是新发病例 4、病例的来源 - Hospital-based(以医院为基础) 诊断正确,易获得;代表性差(容易发生选择偏倚) - Community or population-based(以社区为基础) 普查或抽样调查资料 疾病监测资料 疾病登记报告系统等 ※对照的选择 病例对照研究设计中最困难、争议最多的方面 1、设置对照的目的: - 估计目标人群的暴露比例 - 与病例组的暴露比例进行比较 - 平衡研究因素之外的其他因素对研究结果的干扰 2、选择原则: - 代表性:能代表目标人群暴露的分布情况 - 可比性:在某些因素或特征上与病例尽可能一致 对照应满足的条件  对照最好是全人群的一个无偏样本;或者是产生病例的源人群(source population)中全体未患该病者的一个随机样本  对照一定未患所研究的疾病,如有可能,应尽可能排除亚临床或处于潜伏期的疾病

代表性强;不宜获  对照可为不健康者,但所患疾病病因不应与所研究疾病的病因相同  注意研究因素以外其他因素的均衡性  无应答者要有统一合理的更换办法,慎重处理 3、常见的对照来源 1)医院对照 hospital or clinic controls 优点:容易配合 缺点:代表性差,对照的其他疾病影响 2)人群对照 population controls 优点:代表性好 缺点:不易实施,不易配合 3)特殊对照 special controls 病例的邻居、朋友、同事、配偶、亲属等,用于匹配研究 四、估计样本含量 1、样本量的决定因素: 1)研究因素在对照人群中的估计暴露率p0,及在病例人群中的暴露率P1 d = P1 - P0 ↑ → 样本量↓ 2)研究因素与疾病关联强度的估计值,即RR或OR RR/OR 远离1 → 样本量↓ 3)假设检验的显着性水平,即第一类错误α 4)要求的把握度,即1-β 估算样本量需注意!  总样本量相同的情况下,病例组和对照组样本量相同时,统计学效率最高  公式计算出的是估计值,不精确  样本量大,结果的精确度较好,但也会增加调查工作的负担和费用 五、研究因素的选定与测量 1、暴露因素的选择 1)描述性研究提出的线索 2)参考前人进行的病例对照研究 3)其他学科领域的研究进展 2、暴露因素的测量 暴露的定义、暴露水平、暴露方式、测量方法。。。 第四节 资料的整理与分析 基本步骤  资料的整理 1.原始资料的重新核查 2.资料的分组、归纳,或者编码、输入计算机  数据的统计分析 1.描述性统计 描述研究对象的一般特征,进行均衡性检验 2.关联性的统计推断 数据的统计分析 (一)描述性统计 1、描述研究对象的一般特征 如进行了匹配需描述匹配的因素与方法 2、均衡性检验 检查病例组与对照组是否均衡可比 如果不可比,在后续分析中需进行调整 (二)统计推断  将资料整理成表格形式  病例和对照组暴露比例差异的显着性检 → 即回答E和D是否有联系?  估计暴露因素和疾病之间的联系强度,计算95%可信区间  结果解释 → 可能存在哪些偏倚?得出什么结论? 关联强度分析 1、不匹配或成组匹配的资料分析 要记得相应的卡方公式, 检验四个表 X2=(ad-bc)2T/m1*m0*n1*n0 T表示a+b+c+d 病例对照研究用OR来表示关联强度  OR:odds ratio,比数比,交叉乘积比  OR定义为病例组的暴露比值和对照组的暴露比值之比 病例组的暴露比值=a/(a+c)比上c/(a+c)=a/c,相当于用暴露的除以未暴露的 对OR的理解  由于病例对照研究无法得知危险人群的大小,也即无法获得发病率资料,故无法计算相对危险度(RR),只能通过OR估计关联强度,也即OR是RR的估计值  OR的意义与RR相同,表示的是暴露者发生某种疾病的风险是非暴露者的多少倍

暴露因素 病例组 对照组 合计 有 a b a+b=n

1

无 c d c+d=n

0

Total a+c=m1 b+d=m0 a+b+c+d=n

bcaddbcaOR//  对于罕见病(发病率< 5%)来说,通过OR可以很好估计RR OR值是一个样本的点估计值,他不能反映总体OR值,故需用样本OR推测总体OR所在范围。 95% CI不包括1,说明OR=2.97不是抽样误差,吸烟是肺癌的危险因素 2、 1︰1匹配的资料分析 OR = c/b(病例组/对照组)

第五节 常见偏倚及其控制 一、选择偏倚 1、入院率偏倚 admission bias 也称Berkson偏倚  研究对象从医院获得,与一般人群有差异,不同医院来源的对象也有差异  控制方法:设计阶段尽量采用随机抽样方法选择对象,在多个医院选择病例,在人群中选择对照 2、现患病例-新发病例偏倚 prevalence-incidence bias,也称奈曼偏倚 Neyman bias  研究对象多为现患病例,更多提供了与存活相关的信息,且可能改变暴露因素  控制方法:尽量以新发病例为纳入对象,或进行队列研究,同时将暴露程度、暴露时间和暴露结局联系起来进行结论推断 3、检出症候偏倚 detection bias 也称暴露偏倚 unmasking bias  有暴露因素者某种与疾病无关的症状而就医,从而提高了早期病例的检出率,导致过高地估计了暴露的作用,产生系统误差  控制方法:如果延长收集病例的时间,使其超过由早期向中、晚期发生的时间,

1:1 对照组 病例组 合计

X2=(b-c)

相关主题