病例对照研究
3/4
有 0/4
合计
7/8 21/32 3/8 1/32
平均 26.1 29.3
Χ2
自由度为 1①
0.53
4.52
P
0.50
(不显著②)
(不显著)
<0.05
OR
5.7
8.0
s 注 ① 用 Pike 与 Morrow 的配对对照Χ2 检验公式。 ② 配对 t 检验, x =1.7 岁
以往流产史
病例 对照
用公式求:
p1=(2×0.2)/(1-0.2+2×0.2)=0.333
q0=1-0.2=0.8
q1=1-0.3333=0.6667
p =(0.2+0.3333)/2=0.2667
q =1-0.2667=0.7333
Zα=1.96,Zβ=1.282
代入公式
(1.96 2×0.2667×0.733+1.282 0.2×0.8+0.3333×0.6667)2 N = ──────────────────────────
描述性分析
1、描术研究对象的一般特征:研究对象 人数及各种特征的构成、如性别、年龄、 职业、疾病类型的分布等. 2、均衡性检验:比较两组某些基本特征 是否相似或齐同. 目的是检验病例组与对 照组是否有可比性。
研究步骤
❖ Herbst对阴道腺癌危险因素进行探索
❖ 7例病人加上另一个医院的1例阴道腺 癌患者作为病例组
❖ 每个病人配4个对照,共32个对照 ❖ 用标准调查表对病例、对照与她们的母
亲进行了调查研究,经统计学处理后的 主要结果见表
研究结果
表 阴道腺癌病例与对照的母亲主要暴露因素的比较
母亲年龄 病
❖ 医院住院或门诊的病例
对照的选择
要求 ➢ 候选对象必须来自产生病例的总体,即来自同一 人群; ➢ 未患此病的人(可以是其它疾病);对照一旦发 生所研究的疾病便成为病例组的研究对象 ➢ 不能有共同危险因素的疾病病人; ➢ 除研究因素外其它条件一致;
来源
❖
❖ ❖
研究的总体人群或抽样人群中具有代表性的 非病例 医院中患有其他疾病的病人 亲属、邻居、同事、同学等
提出假设
根据以往疾病分布研究或现况调 查结果并结合文献,提出病因假设
明确研究目的,选择适宜的对照形式
原则
➢ 广泛探索病因,采用不匹配或频数匹配 ➢ 罕见病采用个体匹配 ➢ 1:R的匹配法,R值不宜超过4
形式
➢ 成组比较法 ➢ 匹配法
病例与对照的选择
进行病例对照研究时,病例组与对照组的正 确选择是该研究成败的关键。
有 1/4 有 1/4 否 1/4 有 0/4 否 1/4 有 0/4 有 1/4 有 0/4 6/8 5/32
7.16 <0.01
10.5
此次怀孕时使 用过雌激素
病例 对照
有 0/4 有 0/4 有 0/4 有 0/4 否 0/4 有 0/4 有 0/4 有 0/4 7/8 0/32
23.22 <0.00001
基本原则
➢ 代表性 病例能代表总体的病例 对照能代表产生病例的总体人群或源人群
➢ 可比性 两组主要特征方面无明显差异
病例的选择
要求
❖ 诊断可靠,尽量使用金标准 ❖ 病例内外部特征的限制
内部━━患病部位、病理类型。 外部━━年龄、性别、种族。
➢ 病例类型的选择
新发、现患、死亡。
病例的选择
来源
❖ 总体人群中的全部病例或者随机样本人群中 的全部病例
2、为什么匹配
提高研究效率, 表现为每个研究对象 提供的信息量增加。
控制混杂因素的作用,当然分层分析 也可以控制混杂因素
3、怎样匹配
频数匹配(frequency matching):匹配的 因素在对照组和病例组所占的比例一致,即 是匹配因素的分布相同。它是整体的匹配。 比如某项研究中按性别匹配,病例组男女各 半,则对照组也应如此。 个体匹配(pair matching):以病例和对照 的个体为单位进行匹配。有1:1,1:2, 1:3,……1:R匹配。
➢ 两者的区别主要是匹配的单位不同。
➢ 关于何时运用频数匹配和个体匹配,应 主要根据研究目的,所需样本量,匹配 因素的性质,研究现场实际情况综合考 虑。
➢ 研究罕见病,病例少,多用个体匹配。
➢ 按照年龄,匹配,多考虑用频数匹配。
➢ 按照特定混杂因素多用个体匹配。
注意以上只是惯常的思维,并不绝对。具 体情况具体分析。
中的女儿以后发生阴道腺癌的危险性增加
病例对照研究的类型
(一)病例与对照不匹配 (二)病例与对照匹配
(一)病例与对照不匹配
又称成组比较法,按与病例组可比的 原则,选择一定数量的对照。
(二)病例与对照匹配
1、什么是匹配
匹配(matching)或称配比:要求对照在某
些因素或特征上与病例保持一致。
匹配:是一种常用的选择对照的方法。
对照(无病者)
时间
某人群
暴露 有 无
合计
病例对照研究资料整理表
病例组 a c
a+c
对照组 b d
b+d
合计 a+b c+d a+b+c+d
OR:(a/c)/(b/d)=ad/bc
病例对照研究的用途
病例对照研究主要用于研究病因未明或 多因素疾病的病因,或称危险因素。
( 年轻女性阴道腺癌与母亲妊娠期服用乙烯雌酚的关系)
0.005
2.576
2.807
0.010
2.326
2.576
0.020
2.058
2.326
0.025
1.960
2.242
0.050
1.645
1.960
0.100
1.282
1.645
0.200
0.842
1.282
───────────────────────────────
例如在一次吸烟与肺癌关系的研究中,估计对照组有 20%吸烟史,OR值约为2,要求α=0.05,β=0.1,求 样本大小N?
➢ 匹配因素必须选择那些明确(clearly) 能引起混杂作用的因子。
➢ 年龄,性别,常被用于匹配。
匹配的比例
个体匹配时,以M代表对照的个数, 研究效率=M/(M+1)。一般来讲,比例 M越大,统计效率越高。但比例数与效 率的提高不成比例,两者的关系见表。
所以对照和病例的比例以不超过4为 宜。
对照/病例比例与效率关系
病例对照研究
郑全庆
流行病与卫生统计学教研室
分析性研究 (analytical epidemiology )
病例对照研究(case-control study)和 队列研究(cohort study)均属于分析性 的研究 。
病例对照研究是分析流行病学研究方 法中最基本、最重要的的研究类型之一, 是验证病因假说的重要工具,是一种由 果及因的回顾性研究方式。
病例对照研究基本原理
以确诊的患有某种特定疾病的病人作为 病例,以不患有该病但具有可比性的个 体作为对照,通过询问、实验室检查或 复查病史,搜集既往各种可能的危险因 素暴露史、测量并比较病例组与对照组 各因素的暴露比例,经统计学检验该因 素与疾病之间是否存在统计学关联。从 而达到探索和检验疾病病因假说的目的。
基本原理
评估偏倚
统计学检验
特特定定疾 病疾的病病 病人人
探索和 检验病 因假说
统计学 关联
病因推断
源
收集 数据
可比
人
群
未不患患该 病有的该人
病
病例和对照的选择
特点
❖ 是一种回顾性研究 ❖ 是一种从“果”到“因”的研
究 ❖ 设有对照组
病例对照研究设计
暴露 非暴露
调查方向
病例(有病者)
暴露 非暴露
样本大小的估计
1、有关的影响因素: (1)、研究因素在对照组中的暴露率; (2)、估计该因素引起相对危险度; (3)、希望达到的精确度; (4)、希望达到的检验把握度; (5)、是单侧还是双侧检验;
2、估计的方法: 样本只是一个估计值,过大、过小都
不好。
(一)有关参数
❖ 病例组的暴露率(P1 )和对照组暴露(P0 ) ❖ 优势比(odds ratio, OR)
❖ α值 ❖ 把握度1-β
(二)方法 ❖ 查表法 ❖ 公式法:
计算应用下列公式:
非匹配设计的样本量计算
n (z
2 pq z p0q0 p1q1 )2 ( p1 p0 )2
p1 p0OR /[1 p0 (OR 1)]
, Zα与 Zβ 分别为与α及β值对应的标准正态分布分位数 p0与p1分
设α=0.05;β=0.1, 对照组暴露比例为p0=0.3,
估计的OR=2;则p=2/3、m=90;
p1=0.46; p0=0.3 M=186
研究因素的确定和资料的收集 (一)研究因素的确定
1、变量的选定 2、变量的标准 3、变量的测量 4、变量的可靠性
(二)资料来源与收集
1、资料来源 2、调查的含义及实施时遵循的原则 3、调查表
对照/病例 理论上可获得信息量(%) 净增信息量(%)
1
50
50
2
67
17
3
75
8
4
80
5
5
83
3
4、匹配中的问题
匹配的比例(个体匹配) 匹配过头
匹配过头
把不必要的项目列入匹配会造成匹配过头。 ➢ 增加了选择对照的难度,降低了研究效率。 ➢ 使病例与对照尽量一致,就可能徒然丢失
信息。
为防止匹配过头:
所以,匹配并非一定要用。 但为了特定的目的如提高研究效率和控 制混杂因素作用则需要匹配。 一般除年龄、性别或已知的、明确的混 杂因子之外,对于其他因素是否引入匹配须 持慎重态度,以防止匹配过度及徒增费用和 难度。