当前位置:文档之家› 预防医学之分类变量的统计推断

预防医学之分类变量的统计推断

• 特点:多来源于随访性资料、分母中含有时间定义、取值有时会 超过1(时间取半年、半月)
• 常用指标有:发病率、死亡率、出生率等
应用相对数的注意事项
• 防止概念混淆;分析时不能以构成比代替 率
• 计算相对数的分母一般不宜过小 • 正确地合并估计率(平均率或合计率) • 相对数比较时要注意可比性
防止概念混淆

10
10.00

10
10.00

20Biblioteka 20.00夏20
20.00

30
30.00

30
30.00

40
40.00

40
40.00
相对数比较时的可比性
甲院
乙院
科室
出院人数 治愈人数 治愈率(%) 出院人数 治愈人数 治愈率(%)
内科 876 295 33.67
329 104 31.61
外科 305 292 95.74
• 可见这两组资料内部的构成不同(不同的科室治愈 率是不同的),可比性差,不可直接比较总治愈或 合计治愈率
率的标准化
• 采用统一的标准对内部构成不同的各组频率进行 调整,而后对比各组标准化率的方法称为率的标 准化法
• 调整后的率为标准化率,简称标化率(standard rate),或调整率(adjusted rate)
患病人数 9 13 91
102 12 227
患病率(1/万) 0.9 2.9 13.0 16.0 37.5 7.9
60岁以上年龄段为高血压的高危年龄段!
相对数
• 对分类变量汇总后,通常这些频数不能直 接比较;分类资料的统计描述与推断中通 常使用相对数,而不是绝对数
• 相对数指标是由两个有联系的指标之比组 成
2、构成比
• 构成比proportion含义:反映事物内部某个部分占总 体的比重;分子包含在分母中
• 计算公式:
构 成 比 = 同 一 事 物 某 内 一 部 组 各 成 组 部 成 分 单 个 位 体 个 数 体 的 总 数 比 例 基 数 K K 可 以 根 据 具 体 情 况 取 % 、 000、 1万 、 110万 等 。 • 特点:无量纲、在0~1间取值、不独立性、可加性 • 常用指标有:性别构成、疾病构成、年龄构成、职业
预防医学之分类变量的统计推断
路漫漫其悠远
少壮不努力,老大徒悲伤
分类资料的统计描述
• 分类变量的取值为某种属性,例如: 血型(A、B、O、AB) 人群中某病发生与否(发生、不发生) 性别(男性、女性) 视力等级(差 、中、好)
• 这些变量值无法直接进行统计运算,通常的做法是按照 类别进行统计汇总,分别计算每一个类别的观察单位数, 即某个分类的频数
构成等
3、率
• 率rate含义:反映某一时间段内,某一事件出现的机会大小(近 似于一段时间内发生某事件的平均概率)
• 计算公式:
率 = 某 一 时 间 内 发 生 某 现 象 的 个 体 数 K 同 期 可 能 发 生 该 事 件 的 总 个 体 数
K 可 以 根 据 具 体 情 况 取 % 、 000、 1万 、 110万 等 ; 时 间 通 常 取 一 年 。
常用的相对数指标
• 比(ratio) • 构成比(proportion) • 率(rate)
1、相对比
• 相对比ratio含义:两个相关联的指标之比 • 计算公式:
相 对 比 型 指A标 指= 标 B指 标
• 特点:无量纲、取值可以超过1;A与B的量纲可以相 同也可以不同,但是A与B互不包含
• 常用指标有:性别比、每千人口的医生数、动态数列 分析指标等
• 并非所有 含“率” 的指标都表达是发生的可能性大 小,很多情况下这些含“率”的指标是相对比
• 例如:
5岁以下儿童死亡率=某年5岁以下儿童死亡数 同年活产儿总数
孕产妇死亡率=某年孕产妇死亡数 同年活产儿总数
proportion vs. rate
某年某市高血压发病情况
季节 发病人数 百分比(%)
某年某市畸胎发病情况 季节 畸胎例数 百分比(%)
生存率 (%)

45
35 77.77 300 215 71.67
有 710 450 68.38 83
42 50.60
合计 755 485 64.24 383 257 67.10
标准化率的计算
• 率的标准化的方法通常有直接与间接 法两种
• 两种方法的使用条件不同
直接标准化率
• 已知各构成组分的率时(或已知各组分的 观察单位数与各组分观察阳性数),可采 用该法
• 将要比较的两组中任意一组作为共用标准
直接标准化率
腋下 淋巴结
转移

标准人口数 Ni
(ni=n甲+n乙)
345 ×
甲院
原生存率 pi
• 标准化的目的是使得不同构成的各组间比较时具 有可比性;其做法是对那些在各组间分布不均衡, 并且可能对研究结果造成影响的因素(混杂因素) 进行调整、校正,使得它们对结果的影响在各组 间一致
• 常见的混杂因素有年龄、性别、病情等
率的标准化
甲医院
乙医院
淋巴结
转移
病例数
生存数
生存率 (%)
病例数
生存数
• 在用直接标准化法计算标准化率(标化率) 时要选择一个“标准人群”,例如:标准 人口、标准年龄构成,等
• 该标准不可随便选择,一般选用标准的方 法有三种
直接标准化率——标准选取
• 选择一个有代表性的、内部构成相对稳定 的较大人群作为标准;例如全国人口、全 省人口
• 将要比较的两组资料合并后作为共同的标 准
• 将上述频数绘制成频数分布表
某年某社区各年龄居民高血压患病情况
年龄 20~ 30~ 40~ 50~ 60及以上 合计
患病人数 9 13 91
102 12 227
40~与50~年龄段为高血压的高危年龄段!
某年某单位各年龄居民高血压患病情况
年龄 20~ 30~ 40~ 50~ ≥60 合计
调查人数 1045 443 702 637 32 2859
702 657 93.59
妇科 564 492 87.23
591 501 84.77
儿科 329 301 91.49
263 233 88.59
合计 2074 1380 66.54 1885 1495 79.31
4、率的标准化
• 出现这种矛盾现象的原因在于两院不同科室病例 构成不同
• 甲院以内科病例居多,乙院却以外科病例居多, 而外科病例的治愈情况较内科好得多,造成乙院 的治愈人数较多,在合计时乙院的总治愈率高于 甲院
相关主题