流行病学 病例队列研究
五、 病例队列研究的优缺点
病例队列设计的主要优点为:
1 节约样本量,节省人力、物力和财力。一般认为病例队列 设计样本量只需队列研究的1/6,也即可节约5/6的样本量, 从而可节省大量的资金和人力等。
2 设计的效率高,一个对照组可运用于多种疾病的研究。
3 即使无法获得队列中每个成员的信息,仍可估计RR值。
计算RR和RR的95%可信区间
用Cox比例风险模型计算,以低硒组的RR为1,其它组与低 硒组进行比较.
结论
血清硒水平的高低与食道癌和胃贲门癌 发生呈负相关,硒水平越高,该两种癌症 的发病率越低,提示硒对食道癌和胃贲门 癌可能有预防作用。
5 获得的信息不一样:巢式病例对照研究,须在获 得队列中每个成员的信息才能得到RR值,但病 例队列研究在无法获得每个成员信息的情况下 可以估计RR值。
6 两者的计算指标不同:巢式病例对照研究计算 OR值,而病例队列研究计算OR值和RR估计值。
7 两者的最佳适用场合不同:
在一般情况下,能运用巢式病例对照设计进行的研究,也能用病例队 列设计来对其研究。
4 观察期限 从1985年至1991年。
5 基线信息的获取 研究之初对全队列的 所有对象进行面访调查、体检、并抽取 10ml血样。
6. 随访并确诊上消化道癌症病人 在随访期内共发现 全队列中各种上消化道癌症1179例,其中食道癌640例、 胃贲门癌435例、其它胃癌104例。排除其中血样不够 或不合格者100例,剩余1079例作为病例组(包括食道 癌590例、胃贲门癌402例、其它胃癌87例)。
7. 资料分析 将病例组和子队列对象的协变量信息抽 出作统计分析,根据全队列人群的硒水平的实际情况将 血清硒水平分为低、中低、中高、高硒组共4个水平。
累积发病率
总上消化道癌症发病率为 1179/29584=39.85‰ 食道癌发病率为 640/29584=21.63‰ 胃贲门癌发病率为 435/29584=14.70‰ 其它胃癌发病率为 104/29584=3.52‰
3 队列成员入选机会不一样:在巢式病例对照研究中,队列成 员被选为对照组的机会与他(她)在队列中所贡献的人时数 成正比,在危险集中一个5年后发病的人入选对照组的机会 比1年即发病的人高5倍。而在病例队列研究中则不然,全 队列中的每个成员无论对队列的人时数贡献大小,其入选 机会都是一样的。
4 分析方法不同:巢式病例对照研究可用条件logistic回归等 方法进行分析,而病例队列研究则需用Cox回归结合加权技 术进行分析 。
4 确定观察期限
对全队列跟踪随访一段时间,随访的时间根据所 研究疾病的病程、自然史而定。收集随访期间某 研究疾病的新发病例组成病例组。
5 收集信息 将所有病例和子队列的对象的有关疾病、相关
因素及其它协变量的信息及时、完整地收集上来, 并对有关生物标本进行化验。
三、资料分析 (一)率的计算
•
累积发病率=(随访期所有新发病例/全队列的总
4 选择对照较简单,不必考虑结局即可进行随机抽样。
5 在整个研究过程中都可对子队列的依从性、生物学前体 的变化进行监测。
病例队列研究也有一些局限性:
1 病例和对照组的重叠,即对照组中存在着部 分所研究的疾病的病例。因此对于相同数量的 病例,病例队列研究需要比病例对照研究更多的 对照才能获得同样的统计效率。假设源队列中 有20%的人发病,则病例队列研究的对照数量 须为病例数量的1.25倍,才能保证病例与对照 的人数相同;
但两者的最佳适用条件有差别。
巢式病例对照研究最佳适用:在队列研究的随访开始后又出现了一 种新的病因假说,而这种因素未被测量;另一种情况为研究某些生 物学前体与疾病的关联。
而病例队列设计的最佳适用情况为:在作某个发病率很低的巨大队 列研究中,要分析发病时间的影响因素时,病例队列设计是最佳选 择;
另外在需要计算某个队列的发病率、标化死亡比及进行外部比较 时,病例队列研究也是首选设计方法。
可以用pseudo-risk1和pesudo-risk0之比来估计RR值:
RR估=Pseudo-risk1/Pseudo-risk0
=(A1/B1)/(A0/B0)=(A195%CI估计值
11.96 / 2
(四)Cox比例风险模型分析
病例队列研究多用于大样本队列中发病者较少 而截尾观察结果占大多数的情况下,而上述计算分 析方法显然未充分利用截尾数据并且在研究因素 有多个时更无法分析,故在实际应用过程中病例队 列研究主要用Cox比例风险模型来进行分析。
病例组 子队列(排除病例) 合计
a
b
a+b
c
d
c+d
a+c
b+d
a+b+c+d=n
OR=ad/bc, OR的95%CI
1.96 1 1 1 1
OR95%CI OR e a b c d
(三)RR值及95%可信限估计
在病例队列研究中,一般用对照组(子队列)有暴露史的 人数和无暴露史的人数作为发病比率的实际分母来求得 虚拟危险度(Pseudo-risks),
人数)×1000‰
•
• 发病密度=(随访期内的所有新发病例/随访期内全 队列的暴露人年数)×100000/10万
标化发病比=研究队列的实际发病数/(全队列的总人 数×一般人群发病率)
(二) OR值和OR95%CI的计算
暴露史 有 无 合计
病例组和对照(子队列)的资料整理成如表
表1 病例队列研究的分析表
2 病例队列研究的分析计算比较复杂。
病例队列研究应用实例
MarkSD.等人(2000年)在中国林县作了一次有关血清 硒水平与上消化道癌症关联性的病例队列研究,其设计和 分析结果如下。 1 研究目的 探索血清硒水平的高低与上消化道癌症的 关系。 2 确定研究队列(全队列) 以林县4个乡镇的年龄位于 40~69岁之间的所有对象共29584人作为研究队列。 3 确定对照组(子队列) 采用分层整群随机的方法,抽取 1062人作为对照组。
随机 抽取 部分 对象 作为 对照 组 (子 队列)
随访 并收 集全 队列 病人 作病 例组
比较 病例 组和 子队 列的 资料
OR 估计
RR值估计
COX模型 估计危险 度
二 病例队列研究的设计步骤
1、确定研究目的 2、确定全队列
根据研究目的确定一合适人群作为病例队列研 究的全队列,全队列的样本量大小一般用病例组估 计人数除以该病发病率来估算。
四、优缺点 (一)病例队列研究与巢式病例对照研究的区别
1 对照的选择方法和时间不一样:巢式病例对照研究采 用危险集抽样,即在每个病例发病时,按一定的条件在未 发病的人中随机抽取几个人作为对照。而病例队列研 究则采用随机抽样的方法,在研究一开始即抽取全队列 的一个样本作为对照组;
2 对照的适用范围不一样:巢式病例对照研究中不同的疾 病需分别选取对照,而病例队列研究中不同的疾病共 用一个对照组;
一 病例队列研究的设计原理
首先确定某个人群作为所研究的队列(全队列), 然后在该队列中用随机的方法抽取一个样本(即子 队列)作为对照组,再收集全队列中所有的欲研究 疾病的病例作为病例组,最后比较分析两组资料,以 探索影响疾病发生、疾病生存时间、预后等的因 素(见图)。
根据 研究目 的确定 某一合 适人群 作为研 究队列 (全队 列)
病例队列研究 case cohort study
背景资料
在一个大样本队列中,随访一段时间后只能得到少量 病人,其他大多数对象只能得到截尾(censored)观察结果, 这时如果要获得所有对象的协变量资料作统计分析,则需 花费大量的资源。为此,Prentice RL在1986年提出了一 种新的设计方法——病例队列研究(case cohort study), 该设计仅收集全部研究对象(全队列)中的一个随机样本(子 队列,sub-cohort)和所有发病者(不论是否在子队列内)的 协变量资料进行分析。
即Pseudo-risk1=A1/B1,Pseudo-risk0=A0/B0 此处pseudo-risk1和pseudo-risk0分别表示暴露组的虚 拟危险度和非暴露组的虚拟危险度,A1和A0分别表示子 队列中有暴露史的人中的发病人数和无暴露史的发病人 数,B1和B0分别表示有暴露史的对照人数和无暴露史的对 照人数。
3、确定对照组(子队列)
利用随机抽样的方法(单纯随机,分层随机、分层 整群随机等)从全队列中抽取一部分有代表性的人 群(即子队列)作为对照组。
子队列的数量要根据研究要求及研究疾病的发 病率来定。如果要求对照组中非病例的数量与全 队列中的病例的总数相等,那么子队列的人数至少 为:病例总数×(1/(1-该病发病率))。