当前位置:
文档之家› 医学统计 分类变量的描述性统计
医学统计 分类变量的描述性统计
b /(a b)
d /(c d )
该暴露因素的优势比: OR = a /(a b) c /(c d ) ad
b /(a b) d /(c d ) bc
相对危险度RR的本质是暴露组与非暴露组发病率之比或发病概率 之比。但病例对照研究不能计算发病率,只能计算比值比OR值。 OR与RR的含义是相同的,也是指暴露组的疾病危险性为非暴露组 的多少倍。当疾病发病率小于5%时,OR是RR的极好近似值。
2. 标准化的基本思想
标准化法的基本思想:将所比较的两组或多组 资料的构成按统一的“标准”调整后,计算标 化率,使其具有可比性。 需指定一个标准的人口构成,消除内部构成的 影响。
3. 标准组的选择
应根据研究目的选择有代表性、较稳定和数量较大的人 群作为标准组。例如,世界、全国、全省、本地的数据 作为标准较理想。 选择方法:①以两组资料中任一组的年龄别人口数或构 成比作为标准组;②以两组资料合并的各年龄组的人口 数或构成比作为标准组;③以公认的或便于与他人资料 比较的标准作为标准组, 例如,用全国、全省或本地区 的年龄别人口构成作为标准。 以上三种方法中,最好尽量采用第三种,这样便于与其 他地区进行比较,第一、二种方法只适用于所研究的两 组资料。
人口 数 (1)
1398 5322 5463 8347 12937 10227
43694
甲地 人口
发病 年龄 人数 构成 比(2) (3) 0.0320 25 0.1218 90 0.1250 108 0.1910 66 0.2961 27 0.2341 10
1.0000 326
人口 发病 数 率(4) (5)
计算公式:
构成比 某一组成部分的观察单位数 100% 同一事物各组成部分的观察单位数
注意:①所有组成部分的构成比之和应等于100%; ②同一事物内部各组成部分的构成比,计算时小数点 后保留位数应相同。
3. 相对比
相对比(relative ratio),亦称比,是A、B 2个有关指 标之比,说明A为B的若干倍或百分之几。两个指标 可以是性质相同的,也可以是性质不同的;两个指 标可以是绝对数,也可以是相对数或平均数。
其发病前的暴调露查情方向况:收,集并回顾进性行资料比较,推测疾病与
暴比露较间的关系人。数 暴露
疾病
a/(a+b) c/(c+d)
a
+
b
-
c
+
d
-
病例对照原理示意图
病例 对照
是否暴露 暴露组 未暴露组 合计
病例 a c a+c
对照 b d b+d
合计 a+b(n1) c+d(n2) n
病例组暴露的优势: a /(a b) 、对照组暴露的优势: c /(c d )
178.83 169.11 197.69 79.07 20.87
9.78
74.61
1506 2746 2303 7575 21441 8727 44298
乙地 人口
发病 年 龄 人数 构成 比(6) (7) 0.0340 28 0.0620 55 0.0520 48 0.1710 60 0.4840 86 0.1970 10
该时点人口数
k
期间患病率
某观察期间一定人群中现患某病的新旧病例数
同期的平均人口数
k
k 100%,1000/ 千 , 或10000/ 万
常用的频率指标
死亡率(mortality rate):表示在一定期间内,在一定 人群中,死于某病(或死于所有原因)的频率。是测量 人群死亡危险最常用的指标。用于衡量某一时期、一 个地区人群的死亡危险性大小。常以年为单位。
G
1130
合计
12884
§3.2 常用的比例指标
表 1 某校新生性别构成
表 2 某地某年肠道传染病发病情况
性别 男 女 合计
人数 580 470
1050
构成比(%) 55.24 44.76 100.0
是否发病 发病
未发病 合计
人数 300
29700 30000
率(%) 1.0
99.0 100.0
表1用男、女生所占构成比反映全校性别构成情况,表2用 发病率反映肠道传染病的流行程度,这些指标都是用两个 数值之比计算出来的,此类指标通称相对数或比例指标。 将直接统计得到的频数称为绝对数。实际应用中,常把相 对数与绝对数结合应用。
第三章 分类变量的描述性统计
§3.1 分类变量资料的频数表 §3.2 常用的比例指标 §3.3 相对危险度与优度比 §3.4 率的标准化法 §3.5 应用相对数时应注意的事项
§3.1 分类变量资料的频数表
分类变量资料:将观察单位按属性或类别计数所得的 资料。
各类别及其相应的观察单位数构成频数表。分类变量 资料频数表编制方法简单。
分类变量资料用相对数指标描述。常用的相对数指标有率、 构成比和相对比。
1. 率
率(rate),又称频率指标或强度指标,它说明某现象发
生的频率或强度。
计算公式:率
发生某现象的观察单位总数 可能发生某现象的观察单位总数
K
式中,K为比例基数,常用的K有100%或1000‰、
10000/万、100000/10万等。
苗的有效者,不应计入分母内。但实际工作中不易做到,
故分母多用同期平均人口数。
常用的频率指标
患病率(prevalence rate):也称现患率,指某特定时间 内总人口中,曾患有某病(包括新和旧病例)所占的比 例。按观察时间不同分为期间患病率和时点患病率。
时点患病率
某一时点一定人群中现患某病新旧病例数
相对危险度(relative risk, RR) 指暴露于某种危险因素的观察对象其发病、患病或死 亡的危险度与低暴露或无暴露的观察对象的危险度间 的相对比值。 相对危险度常用于队列研究。
• 队列研究(cohort study):也称前瞻性研究、随访研究等。是一种由 因及果的研究,在研究开始时,根据以往有无暴露经历,将研究人 群分为暴露人群和非暴露人群,在一定时期内,随访观察和比较两 组人群的发病率或死亡率。如果两组人群发病率或死亡率差别有统 计学意义,则认为暴露和疾病间存在联系。队列研究验证的暴露因 素在研究开始前已存在,研究者知道每个研究对象的暴露情况。
表 1 某校新生性别构成
性别 男 女 合计
人数 580 470 1050
表 2 某药疗效
疗效 治愈 显效 好转 无效 合计
人数 10 30 50 10 100
分类变量资料的频数表
表 2-6 某市某年各区急性传染病发病数
市区
急性传染病发生数
A
2433
B
3033
C
1650
D
1503
E
1282
F
1853
1.0000 287
发病 率(8)
185.92 200.29 208.42 79.21 40.11 11.46 64.79
1. 标准化的目的
标准化(standardization)的目的在于消除混杂因素 (confounding factor)对结果的影响,使资料具有可 比性。 例如,欲比较两地的总死亡率,若两地的年龄、 性别等构成不同,而年龄、性别等又影响死亡率 时,则年龄、性别等为混杂因素,使两地总死亡 率无可比性。为消除年龄、性别等的影响,可用 标准化法。
OR>1,说明 该因素是疾病的危险性增加,为危险因素; OR<1,说明 该因素是疾病的危险性减小,为保护因素;
§3.4 率的标准化法
标准化的目的 标准化法的基本思想 标准组的选择 标准化率的计算
表 2-7 甲、乙两地感染性腹泻年龄别发病率(1/万)比较
年龄 (岁)
0 1 5 10 20 40 合计
死亡率 某期间 同内 期(因 平某 均病 人)口 死数 亡总数 k
k 100%,1000/ 千,或10000/ 万
死亡率可按病种、年龄、性别、职业等分类计算死亡 专率,用于探讨病因和评价防治措施。
2. 构成比
构成比(proportion),又称构成指标,它说明某事物 (或现象)内部各组成部分所占的比重或分布,常以百 分数表示。
的发病水平。
发病率
一定期间内某人群中某病新病例数
同时期暴露人口数
k
k 100%,1000/ 千 , 或10000/ 万
分子是一定期间内的新发病人数,若在观察期间内一个人
多次患病时,则应多次计为新发病例数,如流感等。
分母中所规定的暴露人口是指可能会发生该病的人群,对
那些不可能患该病的人,如传染病的非易感者,已接种疫
计算公式为: 相对比 A(或100%) B
相对比
A、B为同类指标时,相对比用以说明两事物的相对水平。 常以百分数或倍数表示,如人口出生性别比、两病区病 床数之比。流行病学中常用的相对危险度(RR)、比数比 (OR)也为此类。 A、B为不同类指标时,如人口密度(人/平方公里)、医生 数/千人口、病床数/千人口、小鼠肝重与体重之比等。 相对比是相对数的最简单形式,常用于动态数列的分析。 动态数列是按时间顺序排列起来的一系列统计指标(包括 绝对数、相对数和平均数),用来说明某事物在时间上的 变化和发展趋势。
调查方向:追踪收集资料
暴露
疾病 人数
比较
+
研究人群
-
+a -b
+c -d
a/(a+b) c/(c+d)
队列研究原理示意图
病例 非病例
暴露组
a
b
非暴露组 c
d
合计 n1=a+b n0=c+d