当前位置:文档之家› 流行病学方法(一)基本研究设计和基本统计

流行病学方法(一)基本研究设计和基本统计


父亲高龄的患病率=10/(10+88) = 10.2%
父亲高龄(88)
病例对照的统计值:OR
ASD
父亲非高龄 父亲高龄
比值Odds = 高龄/非高龄
10/90=0.111
OR=odds ratio =0.111/0.087 =1.28
父亲非高龄 正常对照
父亲高龄
8/92=0.087
总结
研究设计 统计值
6
5
4 暴露:
3
一级家族史
+
-
2
+2
1
1
结局:
SCH - 1
2
随访时间
2/3
1/3
家族史 基因型 产后窒息
用药 欺凌 家庭暴力
TIME-VARYING太难测量怎么办?
研究课题:吸烟与肺癌的关系。 手段一:Ever吸烟 手段二:累积吸烟量(10支/日*2年*365天) 手段三:烟包年—每日N包*吸烟M年
病例对照研究 CASE CONTROL STUDIES
已知暴露VS已知结局
6
6
5
5
4
4
3
3
2
2
1
1
病例对照CASE-CONTROL的步 骤
识别病例 • 比较容易 识别对照 • 找有可能发生疾病的个体
• 与病例来自同一个source population
测量暴露 • 用同样的方法测量病例和对照
选择病例和对照
RR=IRR=incidence rate ratio =0.10/0.08 =1.25
队列研究的统计值:RR
患病率 Incidence Rate
父亲高龄 (100)
ASD(10)
父亲非高龄 (50)
ASD(4)
10/100=0.10 4/50=0.08
RR=IRR=incidence rate ratio =0.10/0.08 =1.25
让两组的这些因素的frequency相同:都是80%男性,IQ和年龄分布相同
匹配的数据的统计分析
大部分时候可以按照原来的方式统计 高度匹配(同胞、邻居etc)时用特殊统计方法(conditional logistic regression)
Neil Pierce. Analysis of matched case-control studies.
有结局
+5 结局: SCH 随访时间
暴露:
一级家族史
+
-
6
队列研究 COHORT STUDIES
6
5
4 暴露:
3
一级家族史
+
-
2
+ 5、1
4
1
结局: SCH - 3
6、2
随访时间
队列研究 COHORT STUDIES
6
5
4 暴露:
3
一级家族史
+
-
2
+2
1
1
结局:
SCH - 1
2
随访时间
队列研究 COHORT STUDIES
容易找 对照里不容易“混入”病例 对照所患疾病不能与病例的暴露相同(父亲高龄,sch与asd) 医院的不同科室背后人群可能不同(特诊vs其他,三院产科vs眼科)
3. 家人或朋友(可能和患者类似)
选择对照
1. 人群抽样 2. 医院其他诊断的患者(对照的疾病应该与病例组无关) 3. 家人或朋友(可能和患者类似)
让病例提供尽量多的家人/朋友,然后随机选择 算是一种匹配 可能过度匹配
匹配MATCHING
在某些因素上选择与病例组相同的对照。
是最强的控制混杂因素的方法
从设计上控制
效率高 =
统计方法可以从数学上控制
用更少的n就能达到显著性
提高研究效率
ASD的正常对照,如果只收50%男性,数据的效率会更低。
可能用到 的情况
优点
队列 Cohort
RR
OR
Log-binomial Logistic regression regression
手算?
没有吧?
病例对照 Case Control
OR
All times.
手算?
RR好理解
Logistic模型应用更广泛
什么时候有必要匹配
研究设计阶段—提高收数据的效率 已经有数据时,不要随便删掉数据!!!(核磁研究?)
匹配MATCHING的方法
Individual matching
我们最熟悉 每个病例配一个年龄、性别、IQ相仿的 可以不用精确匹配(如IQ每5/10分为一组进行匹配)
Frequency matching
一点点统计
队列研究的统计值:RR
父亲高龄
正常对照 ASD
患病率 Incidence Rate = 患病/全 部
10/100=0.10
RR=IRR=incidence rate ratio =0.10/0.08 =1.25
正常对照 父亲非高龄
ASD
8/100=0.08
队列研究的统计值:OR
父亲高龄

Sourc 来六院门诊的 有可能被这
e
孤独症儿童 个研究抽样
到的
Study 纳入课题的孤 实际数据 独症儿童
抽样
目的: 抽出来的人群最好地代表Source Population
抓出来的人
从哪些人里抓
说明哪些人的问题
抽样方法?
Source Pop: 来六院就诊 的所有ASD
随机抽样25%
单纯抽样
看似简单,实际会涉及以下偏倚: 1. 有暴露的人更容易被纳入研究—孕期有并发症的母亲,因为
内疚 2. 有暴露得人不愿意被纳入研究—用过同性性行为的人不愿意
加入艾滋病课题 3. 健康对照其实不健康 4. 诊断的准确性—病孩子诊断为健康,健康孩子诊断为有病 5. 病例的代表性—六院就诊的孤独症和社区抽样的孤独症
病例对照CASE-CONTROL的劣 势
1. 只能研究单一结局 2. 生存者偏倚:死亡率高、死得快(or好得快?)的疾病 3. 归因困难—疾病导致暴露,还是暴露导致疾病?
分裂症患者吸烟
Kendler et al. AJP.
病例对照CASE-CONTROL的劣 势
1. 只能研究单一结局 2. 生存者偏倚:死亡率高、死得快(or好得快?)的疾病 3. 归因困难—疾病导致暴露,还是暴露导致疾病? 4. 多数为回顾性—暴露的测量不准(回顾性填量表)
研究课题:奥氮平与肥胖的关系。 手段一:Ever使用奥氮平 手段二:累积奥氮平用量(10mg/日*2年*365天) 手段三:每年(月etc)的奥氮平用量(10mg/日*2年)??
实际操作
6
6
5
5
4
4
3
3
2
2
1
1
队列COHORT的劣势
6
5
贵!特别是对于罕见
4
结局/需要随访很久才
3
出现结局 2
1
队列COHORT的优势
6 5 4 3 2 1
随访时间
队列研究 COHORT STUDIES
6 5 4UDIES
没有家族史 6 5 4 3
2 1
没有结局
随访时间
+ 结局: SCH -
暴露:
一级家族史
+
-
6
队列研究 COHORT STUDIES
6 有家族史
5 4 3
2 1
为什么选择准确那么重要
病例
父亲高龄
从城市+农村选的 样本
父亲高龄
正常人群
父亲高龄
从城市选的样本
父亲高龄
选择对照
1. 人群抽样
电话号码、门牌号、etc 金标准 难实现
2. 医院其他诊断的患者(对照的疾病应该与病例组无关) 3. 家人或朋友(可能和患者类似)
选择对照
1. 人群抽样 2. 医院其他诊断的患者(对照的疾病应该与病例组无关)
病例对照的RR
ASD
父亲非高龄 (90)
父亲高龄(10)
是否父亲高龄的患病率=10/(10+8) = 56%???
父亲非高龄 正常对照 (92)
父亲高龄(8)
对照是我们按需要的配比(1:1~n)收入组的! 因此没办法得知患病率
病例对照
ASD
父亲非高龄 (90)
父亲高龄(10)
正常人群
父亲非高龄 (920)
COHORT和CASE-CONTROL的 区别?
前瞻性vs回顾性? 匹配vs不匹配? 样本量大vs样本量小?
Cohort: 已知暴露,求结局 Case-control:已知结局,求暴露
队列研究COHORT STUDEIS
队列研究 COHORT STUDIES
6 5 4 3 2 1
随访时间
队列研究 COHORT STUDIES
病例对照CASE-CONTROL的优 势
1. 价格低,特别是“罕见”病 2. 结局已经发生了,不用等待发病 3. 可以研究多个暴露
病例对照CASE-CONTROL的劣 势
1. 只能研究单一结局
已知暴露VS已知结局
6
6
5
5
4
4
3
3
2
2
1
1
病例对照CASE-CONTROL的劣 势
1. 只能研究单一结局 2. 生存者偏倚:死亡率高、死得快(or好得快?)的疾病
流行病学和统计方法(一) 队列+病例对照+抽样+匹配
本系列
一、队列+病例对照+抽样+匹配 二、回归 三、混杂因素和交互作用 四、随机化和RCT 五、流行病学的三个主要数据分析思路
相关主题