当前位置：文档之家› 流行病学方法(一)基本研究设计和基本统计

流行病学方法(一)基本研究设计和基本统计

父亲高龄的患病率=10/(10+88) = 10.2%
父亲高龄（88）
病例对照的统计值：OR
ASD
父亲非高龄父亲高龄
比值Odds = 高龄/非高龄
10/90=0.111
OR=odds ratio =0.111/0.087 =1.28
父亲非高龄正常对照
父亲高龄
8/92=0.087
总结
研究设计统计值
6
5
4 暴露：
3
一级家族史
+
-
2
+2
1
1
结局：
SCH - 1
2
随访时间
2/3
1/3
家族史基因型产后窒息
用药欺凌家庭暴力
TIME-VARYING太难测量怎么办？
研究课题：吸烟与肺癌的关系。手段一：Ever吸烟手段二：累积吸烟量（10支/日*2年*365天）手段三：烟包年—每日N包*吸烟M年
病例对照研究 CASE CONTROL STUDIES
已知暴露VS已知结局
6
6
5
5
4
4
3
3
2
2
1
1
病例对照CASE-CONTROL的步骤
识别病例 • 比较容易识别对照 • 找有可能发生疾病的个体
• 与病例来自同一个source population
测量暴露 • 用同样的方法测量病例和对照
选择病例和对照
RR=IRR=incidence rate ratio =0.10/0.08 =1.25
队列研究的统计值：RR
患病率 Incidence Rate
父亲高龄（100）
ASD（10）
父亲非高龄（50）
ASD（4）
10/100=0.10 4/50=0.08
RR=IRR=incidence rate ratio =0.10/0.08 =1.25
让两组的这些因素的frequency相同：都是80%男性，IQ和年龄分布相同
匹配的数据的统计分析
大部分时候可以按照原来的方式统计高度匹配（同胞、邻居etc）时用特殊统计方法（conditional logistic regression）
Neil Pierce. Analysis of matched case-control studies.
有结局
+5 结局： SCH 随访时间
暴露：
一级家族史
+
-
6
队列研究 COHORT STUDIES
6
5
4 暴露：
3
一级家族史
+
-
2
+ 5、1
4
1
结局： SCH - 3
6、2
随访时间
队列研究 COHORT STUDIES
6
5
4 暴露：
3
一级家族史
+
-
2
+2
1
1
结局：
SCH - 1
2
随访时间
队列研究 COHORT STUDIES
容易找对照里不容易“混入”病例对照所患疾病不能与病例的暴露相同（父亲高龄，sch与asd）医院的不同科室背后人群可能不同（特诊vs其他，三院产科vs眼科）
3. 家人或朋友（可能和患者类似）
选择对照
1. 人群抽样 2. 医院其他诊断的患者（对照的疾病应该与病例组无关） 3. 家人或朋友（可能和患者类似）
让病例提供尽量多的家人/朋友，然后随机选择算是一种匹配可能过度匹配
匹配MATCHING
在某些因素上选择与病例组相同的对照。
是最强的控制混杂因素的方法
从设计上控制
效率高 =
统计方法可以从数学上控制
用更少的n就能达到显著性
提高研究效率
ASD的正常对照，如果只收50%男性，数据的效率会更低。
可能用到的情况
优点
队列 Cohort
RR
OR
Log-binomial Logistic regression regression
手算？
没有吧？
病例对照 Case Control
OR
All times.
手算？
RR好理解
Logistic模型应用更广泛
什么时候有必要匹配
研究设计阶段—提高收数据的效率已经有数据时，不要随便删掉数据！！！(核磁研究？）
匹配MATCHING的方法
Individual matching
我们最熟悉每个病例配一个年龄、性别、IQ相仿的可以不用精确匹配（如IQ每5/10分为一组进行匹配）
Frequency matching
一点点统计
队列研究的统计值：RR
父亲高龄
正常对照 ASD
患病率 Incidence Rate = 患病/全部
10/100=0.10
RR=IRR=incidence rate ratio =0.10/0.08 =1.25
正常对照父亲非高龄
ASD
8/100=0.08
队列研究的统计值：OR
父亲高龄
到
Sourc 来六院门诊的有可能被这
e
孤独症儿童个研究抽样
到的
Study 纳入课题的孤实际数据独症儿童
抽样
目的：抽出来的人群最好地代表Source Population
抓出来的人
从哪些人里抓
说明哪些人的问题
抽样方法？
Source Pop：来六院就诊的所有ASD
随机抽样25%
单纯抽样
看似简单，实际会涉及以下偏倚： 1. 有暴露的人更容易被纳入研究—孕期有并发症的母亲，因为
内疚 2. 有暴露得人不愿意被纳入研究—用过同性性行为的人不愿意
加入艾滋病课题 3. 健康对照其实不健康 4. 诊断的准确性—病孩子诊断为健康，健康孩子诊断为有病 5. 病例的代表性—六院就诊的孤独症和社区抽样的孤独症
病例对照CASE-CONTROL的劣势
1. 只能研究单一结局 2. 生存者偏倚：死亡率高、死得快（or好得快？）的疾病 3. 归因困难—疾病导致暴露，还是暴露导致疾病？
分裂症患者吸烟
Kendler et al. AJP.
病例对照CASE-CONTROL的劣势
1. 只能研究单一结局 2. 生存者偏倚：死亡率高、死得快（or好得快？）的疾病 3. 归因困难—疾病导致暴露，还是暴露导致疾病？ 4. 多数为回顾性—暴露的测量不准（回顾性填量表）
研究课题：奥氮平与肥胖的关系。手段一：Ever使用奥氮平手段二：累积奥氮平用量（10mg/日*2年*365天）手段三：每年（月etc）的奥氮平用量（10mg/日*2年）？？
实际操作
6
6
5
5
4
4
3
3
2
2
1
1
队列COHORT的劣势
6
5
贵！特别是对于罕见
4
结局/需要随访很久才
3
出现结局 2
1
队列COHORT的优势
6 5 4 3 2 1
随访时间
队列研究 COHORT STUDIES
6 5 4UDIES
没有家族史 6 5 4 3
2 1
没有结局
随访时间
+ 结局： SCH -
暴露：
一级家族史
+
-
6
队列研究 COHORT STUDIES
6 有家族史
5 4 3
2 1
为什么选择准确那么重要
病例
父亲高龄
从城市+农村选的样本
父亲高龄
正常人群
父亲高龄
从城市选的样本
父亲高龄
选择对照
1. 人群抽样
电话号码、门牌号、etc 金标准难实现
2. 医院其他诊断的患者（对照的疾病应该与病例组无关） 3. 家人或朋友（可能和患者类似）
选择对照
1. 人群抽样 2. 医院其他诊断的患者（对照的疾病应该与病例组无关）
病例对照的RR
ASD
父亲非高龄（90）
父亲高龄（10）
是否父亲高龄的患病率=10/(10+8) = 56%???
父亲非高龄正常对照（92）
父亲高龄（8）
对照是我们按需要的配比（1:1~n）收入组的！因此没办法得知患病率
病例对照
ASD
父亲非高龄（90）
父亲高龄（10）
正常人群
父亲非高龄（920）
COHORT和CASE-CONTROL的区别？
前瞻性vs回顾性？匹配vs不匹配？样本量大vs样本量小？
Cohort: 已知暴露，求结局 Case-control：已知结局，求暴露
队列研究COHORT STUDEIS
队列研究 COHORT STUDIES
6 5 4 3 2 1
随访时间
队列研究 COHORT STUDIES
病例对照CASE-CONTROL的优势
1. 价格低，特别是“罕见”病 2. 结局已经发生了，不用等待发病 3. 可以研究多个暴露
病例对照CASE-CONTROL的劣势
1. 只能研究单一结局
已知暴露VS已知结局
6
6
5
5
4
4
3
3
2
2
1
1
病例对照CASE-CONTROL的劣势
1. 只能研究单一结局 2. 生存者偏倚：死亡率高、死得快（or好得快？）的疾病
流行病学和统计方法（一）队列+病例对照+抽样+匹配
本系列
一、队列+病例对照+抽样+匹配二、回归三、混杂因素和交互作用四、随机化和RCT 五、流行病学的三个主要数据分析思路

e商务文档

流行病学方法(一)基本研究设计和基本统计

相关文档推荐：