第七章队列研究第一节第一节??? 概述一.定义及原理(一) 定义队列研究(cohort study)也称前瞻性研究(prospective study)、发病研究(incidence study)、随访研究(follow study)、纵向研究(longitudinal study)。
队列研究是选定暴露及未暴露于某因素的两种人群,追踪其各自的发病结局,比较两者发病结局的差异,从而判定暴露因子与发病有无因果联系的一种观察研究方法。
(二) 原理及结构模式队列研究方法与病例对照研究方法是分析流行病学中的两种重要方法,它与病例对照研究一样,主要用于检验病因假设。
使用这种方法可以直接观察到人群暴露于可疑病因因素后疾病的变化规律及其结局,通过比较暴露和非暴露人群发病率和死亡率的差别来确定危险因素与疾病的关系。
队列研究的结构模式见图1。
图7-1 队列研究的结构模式从模式图中可以部分的体现出队列研究有以下几个基本特点:1. 属于观察法暴露不是人为给予的,而是在研究开始前就已客观存在,这一点根本区别于实验研究。
2. 设立对照队列研究作为一种分析流行病学研究方法区别于描述流行病学的根本特点就是设立对照组以利于比较。
对照组的选择有多种方法。
3. 由“因”及“果”在研究过程中先确知其因(暴露因素),再纵向前瞻观察而究其果(发病或死亡)。
这一点与实验研究方法一致。
4. 能确证暴露与疾病的因果联系由于队列研究能够得到确切数目人群中的发病人数(发病率),并通过比较暴露与非暴露人群发病率的差异而确定暴露对发病率的影响。
二.目的和用途1.检验病因假设多数时候,队列研究用来研究一种暴露与一种疾病的关联,但它也可同时观察某种暴露因素对人群健康的多方面影响,检验多个假说。
2.描述疾病自然史队列研究可观察到疾病的自然史,即疾病从易感期、潜伏期、临床前期、临床期到结局的整个自然发展过程。
3.预防、治疗及预后研究有时在随访人群中研究对象可能受各种因素的影响而自行采取一种与暴露致病作用相反的措施,出现预防效果,这种现象称为“人群的自然实验”。
此外,队列研究还可研究某种疾病的长期变动趋势,为制订新的预防规划、治疗方案或康复措施提供依据。
三.队列研究的种类(一)(一)?? 三种基本的队列研究根据怎样取得资料,队列研究可分为三种,三种方法的示意图见图2。
(历史性) 研究开始(前瞻性)追溯收集资料追踪收集资料暴露组追踪收集资料非暴露组过去将来图7-21.前瞻性队列研究(prospective cohort study) 研究开始时暴露因素已经存在,但疾病尚未发生,研究的结局要前瞻一段时间才能得到,这种设计模式称为前瞻性队列研究,也叫同时性或即时性(concurrent)队列研究。
它所需观察时间往往很长,要对研究对象进行定期随访。
这是队列研究的基本形式,见图7-2的右半部分。
前瞻性队列研究最大的优点在于不论暴露或结局资料,研究者都可以亲自监督获得一手资料,偏倚较小,而且可根据在随访期间暴露的变动情况选用适当的新的检测方法和观察指标。
这种研究设计类似于干预试验,在因果关系推断上作用较大。
但前瞻性队列研究属于规模巨大的研究,需要观察大量人群并长期随访以获得7-2的;一组20人,u=8.89,P< 2.7倍。
诊断为肝炎、肝硬化的病人进行了登记,各形成一个群组,并以未患肝病的呼吸系统病人为对照组,各组病例除了所患疾病不同外,其它各种因素(年龄、性别、文化程度等)要尽量齐同。
然后在群组中回顾性调查1964~1972年8年间的肝癌发生情况,并前瞻了1974~1976年2年期间肝癌发病情况。
8年历史性队列研究结果提示,肝病病人发生肝癌的危险性明显高于呼吸道病人,相对危险度为10.76,其中慢性肝炎相对危险度为12.17,肝硬化为37.29,急性肝炎为4.01与4.39(黄胆型与无黄胆型)。
2年前瞻性队列研究结果提示,肝炎病人发生肝癌的相对危险度为9.12,其中急性肝炎为4.38,肝硬化为54.42。
由该例看出,8年的历史性队列研究结果与2年前瞻性队列研究取得的结果相比较,除肝硬化组肝癌发生率有差异外,其余各组均接近,说明历史性队列研究所获得的资料是可信的(表7-2)。
表7-2 启东县人民医院肝炎、肝硬化病人与呼吸道病人中肝癌发病率疾病类型1964~1972年1974~1976年人年肝癌发病率(‰)RR 人年肝癌发病率(‰)RR呼吸系统10521 0.86 1.00 3769 0.26 1.00疾病全体肝病8744 9.26 10.76 3800 2.37 9.12急性黄疸型肝炎3999 3.50 4.013510 1.14 4.38急性无黄疸型肝炎2870 3.83 4.39慢性肝炎191 10.47 12.17 78 0肝硬化1684 32.07 37.29 212 14.15 54.42(二)(二)?? 在队列研究基础上发展的新的研究方法1.巢式病例对照研究(nested case-control study)是Mantel于1973提出的一种将队列研究和病例对照研究结合起来的方法,即在队列研究中插入一个病例对照研究,特别适用于研究因素包括有复杂生化分析的露因素称为危险因素(或致病因素),把导致疾病事件降低的暴露因素称为保护因素。
暴露因素的含义是相对的,它既可以是某种疾病的致病因素或保护因素,也可以是另一暴露因素的后果,即疾病。
例如,高血压是脑血管病的暴露因素,但它也可能是遗传或营养等其它暴露因素所产生的疾病事件。
这种暴露因素的相对性取决于研究目的和研究者对暴露因素的认识水平。
因此,在研究开始前应详细了解所要研究的暴露因素,并给予明确定义,定义越具体越好。
例如,成年人高血压的标准是年龄大于等于18岁,舒张压大于95mmHg (12.7kPa)或收缩压大于等于150mmHg(20kPa)连续半年。
总之,暴露因素须有明确的规定,包括暴露因素的性质、暴露的时间、频率、强度等。
若将暴露因素定量,则应明确其单位。
如不易获得准确的定量资料,可将暴露水平粗略地分级。
三.研究对象的选择队列研究根据受暴露与否,将研究对象分为暴露组与对照组。
研究对象的选择是关键步骤,要根据一定的原则进行。
(一) 暴露人群的选择通常将暴露人群分为三类:一般人群、职业人群和特殊暴露人群。
1.一般人群即一个范围明确的地区的全体人群或其样本,由具有不同暴露因素的个体组成;适用于同时观察多种暴露和多种疾病间的关系,若着眼于研究一般人群的发病情况,或暴露因素和疾病在人群中常见,不需要或没有特殊暴露人群,就可以选择一般人群作为暴露人群。
如Framingham地区心脏病研究,该研究的主要目的,是在一般人群中前瞻性的观察冠心病的发病率及年龄、性别、家族史、职业、文化水平、国籍、血压、血脂、体力活动、吸烟、饮酒等因素在冠心病发生发展中的作用。
实际工作中,常选择有组织的人群团体,如机关、团体、学校或详细可靠的人群资料作为一般人群的特殊形式,提高收集随访资料的效率。
2.职业人群某些职业中常存在特殊暴露因子,使职业人群的发病或死亡率远远高于一般人群,选择职业人群进行研究,便于证实暴露与疾病的联系。
如研究联苯胺的致癌作用,选择染料厂工人;研究石棉致肺癌的作用,选择石棉作业工人等。
3.特殊暴露人群指具有特殊暴露经历的人群。
如研究电离辐射的危险性选择原子弹爆炸后的存活者、铀矿工人或医疗过程中的暴露者(放疗后的人)。
(二) 对照人群的选择线暴露者发病率为千分之一。
设α=0.05(双侧),β=0.10(单侧),求样本量。
代入公式=14246.9≈14247人即暴露组和非暴露组各需观察14247人,共28494人。
除了计算,还可以通过查表的方法获得样本含量,只要具备上述四个基本数据,即可从参考书的相应附表中查出所需的样本含量。
(二) 确定样本量大小的四个因素从上述计算样本含量的数学模型中可见样本量的大小主要取决于四个因素:1.非暴露人群的发病率(P0) P0越接近0 .50,所需样本越小。
2.暴露人群的发病率(P1)暴露人群与对照人群两发病率之差越大,所需样本量越小。
若暴露人群发病率P1不易获得,可设法得到相对危险度(RR)的数值,由P1=RR×P0求得P1。
3.显着性水平α即假设检验时的第Ⅰ类错误。
要求假阳性错误出现的概率越小(即α越小),需样本量越大。
通常α取0.05或0.01。
4.检验效能1-β即检验假设时能够避免假阴性出现的能力,β为检验假设时出现第Ⅱ类错误的概率。
若要求1-β越大,即β越小,所需样本量也越大。
通常β取0.10。
(三) 样本量确定应注意的问题1.抽样方法队列研究往往要从实际人群中抽取一定数量的样本。
抽样方法与以前介绍的方法相同,即单纯随机抽样、系统抽样、分层抽样、整群抽样。
要根据样本估计值和实际情况选择恰当的抽样方法,以提高样本的代表性。
具体方法可参考有关章节,此处不重述。
2.暴露组与非暴露组的样本比例二者等量还是对照多于暴露何者为优尚无定论,通常采用等量的做法。
一般说来,对照组样本含量不宜少于暴露组。
3.失访率由于队列研究观察随访时间长,研究对象的失访在所难免。
因此计算样本量时,应预先估计一下失访率,以扩大样本量,防止在研究后期因样本量不足而影响结果的分析。
通常按10%来估计失访率。
以计算出来的样本量再加10%作为实用样本量。
上例中实用样本量应为14247/0.9=15830。
五.队列研究基本信息的收集在队列研究开始实施阶段,必须获得三方面充分细致的基本信息,即与暴露有关的信息、与结局(疾病10%一.分析前的工作象其它科学研究一样,队列研究在现场获得的一手资料往往不能作为直接分析的资料,须先检查调查表上的数据和资料是否准确和完整,并进行一定的加工、处理,使其便于分析研究。
主要包括:1.所选的研究对象及其选择方式是否符合研究设计,凡不符合者,应予剔除。
2.是否调查了调查表上的全部项目并填写了结果,遇有缺项和漏项应补充调查和填写。
3.调查表中所填写的调查资料是否有逻辑性错误,若遇有这类错误应予更正;不合乎要求又无法纠正的表格应剔除。
4.对资料分组、归纳或编码、输入计算机,并抽查核对数据输入过程的正确性。
如发现有较大的输入错误,应检查核对输入的全部数据并加以改正。
二.资料的整理由于队列研究观察时间较长,观察人数常处于变动中(例如迁移、失访或不合作、死亡等)有时研究对象进入队列的时间也不一致,因此,我们常需根据不同情况,将资料整理成不同的形式。
主要有如下两种:(一) 累积发病率的资料整理当研究时间不长,研究人群的数量较多,人口比较稳定,资料比较整齐时,可用固定人口作分母来计算发病率,称之为累积发病率(cumulative incidence)。
如从某年1月1日开始观察至该年底12月31日截止,全年内某疾病发病的累积总数除以该研究人群数,即得出某病的年累积发病率。