分类资料的统计分析..
3
主要内容
一、相对数的概念 二、相对数使用时应注意的问题 三、分类资料的统计
主要内容
一、相对数的概念 二、相对数使用时应注意的问题 三、分类资料的统计
相对数的引入
例:某病用A法治疗100人,有效80人;B法治疗 150人,有效100人。若仅用绝对数80人和100人比 较会得到B法比A法好的错误结论。 在比较两法的疗效,使计数资料具有可比性, 将原始的两个资料(绝对数)之比所得指标统称为 相对数(relative number)。
22
相对数使用应注意的问题
• 要注意资料的可比性
• 影响率或构成比变化的因素很多,除了研究因素外, 其余影响因素应尽可能相同或相近,即在相同条件 下比较才有意义
– 观察对象、研究方法、观察时间、地区和民族等因素应 相同或相近。这些因素须在设计或分析阶段很好地控制。
– 其它对观察结果有影响的因素在比较的各组内部构成是 否相同。否则只比分组比较,或进行标准化
相对数种类
• 比(ratio) • 构成比(proportion) • 率(rate)
比(ratio)
• 两个变量之比
A指标 R= B指标
• 可以是性质相同的两个指标
– 两个地区相同时期内某病新发病例数之比
– 也可以是性质不相同的两个指标之比
• 性别比,货物/销售人员比、人口密度等 • 两者的比值须有专业意义,不能任意求两个指标之比值
10
构成比(proportion)
• 部分占总体的比例 • … 构成比的分子是分母的一部分,所以其取 值必在0与1之间,各部分的构成比之和应 当为1
Hale Waihona Puke 11率(rate)某个时期内某事件发生的频率或强度 具有时间概念的比,实际上可以和物理中速率的 定义相对照
某时期内发生某事件的观察单位数 率 该时期开始时暴露的观察单位数
16
称为率,实为比(ratio)的指标
• 分子与分母不是同一范畴
– 婴儿死亡率(某年不足一岁死亡婴儿数/同年活产数)
• 分子可重复计数
– 计算某地区某年内流感发病率
• 这两种情况的“率”,不能直接用后面介绍的有 关率的统计推断方法作差别的假设检验,也不能 简单地进行可信区间的计算。此类问题可用计算 统计学方法来解决推断问题,也可按其概率分布 规律来进行建模
13
二、相对数使用时应注意的问题
率的误用
• 由于传统原因,医学中有许多指标也会被称为 “率”,他们实际上并不符合率的定义,因此不 能使用和率有关的统计推断方法来进行分析… 名称 为率,实质为构成比的指标。
15
率的误用(举例)
• 横断面调查中常可得出某人群某病患病率,是对 人群中该病患者比例的描述,静态 • 类似还有入院诊断符合率、艾滋病知识知晓率、 低体重儿发生率。其特点也是分子是分母的一部 分,它们也是相应概率的估计值,可以用以后介 绍的方法计算其可信区间和进行差别的假设检验
23
相对数使用应注意的问题
• 要注意使用率的标准化
–除研究因素外的其他影响因素在各组的内部构 成不相同 –如比较两地区总死亡率时,两组资料年龄、性 别构成不同,只能比较分性别、分年龄的率或 标准化率
8
流行病学中常用的比
• 相对危险度(RR,Relative Risk) • 两个率之比
P R= 1 P2
9
流行病学中常用的比
• 比值比/优势比(Odds Ratio)
– Odds:某事件发生(存在)与不发生之比。反映了两 种结局出现的概率差异(优势)
• OR:两种情况下的优势之比
–两个比的“比”,不太好解释,大多数情况下人们希 望能够将优势比按照相对危险度的含义来解释 – 当所关注的事件发生概率比较小时(<0.1),优势比 可作为相对危险度的近似
• 安全期:50 • 避孕套:30 • 子宫环:10 • 药物及其他:10
30 / 100,000 = 万分之三 10 / 10000 = 千分之一 时间跨 度相同
20
相对数使用应注意的问题
• 计算相对数时分母不宜过小
• 除 … 非公认结局的事件,否则只有一两例的 样本并不能说明什么问题
– 某医师用组织埋藏法治疗两例视网膜炎患者, 一例有效,有效率50%
失败人数 (3) 78 39 9 126
失败人数比(%) 失败率(%) (4) (5) 61.9 30.6 31.0 44.8 7.1 52.9 100.0 35.1
原因:分母差异,初期暴露人数 另外:观察时间?
19
相对数使用应注意的问题
• 不要把构成比与率相混淆
–如:临床上观察到100例避孕失败
17
相对数使用应注意的问题
• 不要把构成比与率相混淆
– (地铁时代报新闻)清华大学今年的研究结 果表明,黑车行驶在路上的事故率为50%以 上,而粉色和白色车的事故率则最小。
18
相对数使用应注意的问题
已婚育龄妇女不同情况下放环失败率的比较
放环情况 (1) 人工流产后 月经后 哺乳期 合 计
放环人数 (2) 255 87 17 359
分类资料的统计分析
邹宇量 武汉大学公共卫生学院
变量类型
变量类型
定量变量 分类变量 无序:二项 多项
变量值表现
数值的大小 定性(不相容的 类别) 对立的两类 不相容的多类
例
身高、血压、红细胞数
疗效:治愈、未愈 血型:A、B、AB、O
有序(等级) 类间有程度差别
疗效:治愈、显效、好 转、无效
2
• 此类资料的整理常常先将研究对象按其性 质或特征分类,再分别计数每一类的例数, 常用率、构成比、相对比等指标来进行统 计描述
严格意义上的率:按上式计算,率的分子也应是分母的 一部分,故其取值也应在0到1之间变动
12
实际应用中的率
• 真正意义的率:
– 死亡率-死亡人数与手术人数之比(死亡率) – 术后出院肝癌病人在5年内因肝癌死亡人数与 观察满5年的人数之比(5年生存/死亡率)等
• 需 … 观察一段时间后才能得出,它们也是相 应概率的估计值,可以用以后介绍的方法 计算其可信区间和进行差别的假设检验
– 某医院治愈了一例AIDS
• 以前的千万个未治愈病例在共同提供信息
21
相对数使用应注意的问题
• 计算相对数时分母不宜过小-Ⅱ
– 但动物实验时,可以通过周密设计,严格控制 实验条件,例如某毒理实验,每组用 10只纯种 小鼠也可以了
• 分母到底多大才可以? • 要根据研究目的、研究设计、研究指标而 定!