当前位置:
文档之家› 第五讲 循证医学实践中常用的统计指标与方法(2010秋)
第五讲 循证医学实践中常用的统计指标与方法(2010秋)
由于RR与OR=1时为试验因素与疾病无关,故其
可信区间不包含1时为有统计学意义;反之,其
可信区间包含1时为无统计学意义
试验组<对照组
无统计学意义 1 无效线
试验组>对照组
RR、OR可信区间的图示
实例分析1
阿司匹林治疗心肌梗死的效果
治疗组病死率p1=15/125 对照组病死率p0=30/120 RR= p1 /p0 = 0.48 RR的95%可信区间为:exp㏑(RR)±1.96SE ㏑(RR) =(0.272,0.846)
A
45 异常 严重贫血
B
87 异常 中度贫血
C
117 异常 轻度贫血 特 点
D
143 正常 正常
E
175 异常 血红蛋白 增高
1、有单位;2、连续性变量 无大小、强弱、优劣的差异 有大小、强弱、优劣的差异
数值变量资料包含了最多的统计信息。因此,在临 床研究中应尽可能地选择量化指标反映其效应,尽 可能少用分类变量,一般不宜将数值变量的指标转 变为分类变量后再做统计分析。
OR的计算
回顾性研究的数据可由下表表达: OR计算的四格表
组别 病例组 对照组 暴露 a c 非暴露 b d 例数 n1 n2
ad OR bc
4、EER与CER
EER(experimential event rate)——试验组中
某事件的发生率,如对某疾病采取某些治疗措施 后该疾病的发生率
例如:某医师研究了阿司匹林治疗心肌梗死的效果
EER=a/n1 =15 /125=12%
EER与CER
Hale Waihona Puke CER (control event rate)——对照组中某事件 的发生率,如对某疾病不采取某些治疗措施的发 生率。
例如:某医师研究了阿司匹林治疗心肌梗死的效果
CER=c/n2 = 30 /120=25%
RR的意义及解释(一)
当RR=1,表示试验因素与疾病无关。
当RR≠1,表示试验因素与疾病有关。 当RR>1,表示试验组的发生率大于对照组 当RR<1,表示试验组的发生率小于对照组
RR的意义及解释(二)
当发生率是描述疾病对人群的有害指标(如发病 率、死亡率等)时, RR>1,表示试验因素是有 害因素,且RR越大,试验因素对疾病有害的影响 就越大;当RR <1,表示试验因素是保护因素, 且RR越小,试验因素的保护作用就越大 当发生率是描述疾病对人群的有益指标(如有效 率、缓解率等)时, RR>1,表示试验因素是有 益因素,且RR越大,试验因素对疾病的有益影响 就越大;当RR <1,表示试验因素是有害因素, 且RR越小,试验因素的有害作用就越大
三、科研设计方案
以时间来划分设计方案
横断面 回顾
前瞻
过去
现在
将来
以统计模型来划分 完全随机设计(成组)、配对设计、随机区组 设计、交叉设计等
不同设计方案应选择不同的统计方法
四、数理统计条件
统计方法中的公式和定理,是建立在数据 的资料类型、设计方案和分布特征等基础 之上,也就是说在应用每种统计方法时, 应注意它的应用条件(见表6-7,表6-8)
二、数值变量资料的统计指 标
数值变量资料的常用描述指标
三、可信区间
可信区间的概念
可信区间(confidence interval,CI)是按一定 的概率(1-)估计总体参数所在的范围,这 个范围被称为所估计参数值的可信区间。如95 %可信区间指总体参数被包含在该区间的可能 性是95%,没有被包含的可能性为5%
统计在医学研究中的意义
医学统计学贯穿于医学研究中的资料搜集、整理、 分析与结果解释等全过程。 设计阶段(根据研究目的与资料特点,预设统计分析方 法,确定临床指标;同时进行样本含量估算) 实施、资料收集与整理阶段: 用相应统计分析方法,评估质量控制效果; 检查数据资料的完整性、失访与原因统计 检查极端值与异常值,分析原因与正确处理 分析资料阶段:检查资料是否满足预设统计方法的应 用条件,选用统计学方法。 临床研究的结果表达与评价:真实性、适用性、重要 性,均需要借助统计学知识。
参数估计 利用样本指标估计总体参数。常用 95%可信区间 (如:用120名成都市2003年8岁男孩身高的平 均水平估计总体的平均水平)
假设检验 利用样本提供的信息比较两个或多 个总体之间有无差别。如:t 检验、2检验等
二、数据资料的类型
分两大类:
1. 数值变量资料:用定量的方法对每个观察
对象某项指标数值的大小进行测定,所得 的资料。带有度量衡单位。 例如:身高(cm),体重(kg),血红蛋白 (g%)等。
2. 分类变量资料: 将观察单位按某种属性或类别分组,清 点各组的观察单位数,所得的资料。 例如:血型,性别,阴性/阳性等。
依据类别之间是否有程度上的差别分为
两类:无序分类变量,有序分类变量
无序分类变量:各类别之间性质不同,无
程度上的差别。 例如:性别(男/女),血型(A,B,O, AB)
有序分类变量:各类别之间有程度上的差
注意:病死率与死亡率的区别
例: 截止6月23日公布的累计数字计算,中 国内地感染非典5326人,死亡347人,死亡 率为6.5%,而香港有1755人感染,死亡296 人,死亡率高达16.86%。
2、相对危险度
相对危险度(relative risk,RR)是前瞻性
研究(队列研究)中较常用的指标,它是 试验组(暴露组)的发病率P1与对照组 (非暴露组)的发病率P0之比
统计学假设检验方法的正确选择
常用计量资料的假设检验方法
统计学假设检验方法的正确选择
常用计数资料的假设检验方法
总之,在临床科研工作中,正确地选择 统计分析方法,应充分考虑分析目的、临 床科研设计方法、收集的数据资料类型、 分布特征与所涉及的数理统计条件等。其 中任何一个问题没考虑到或考虑有误,都 有可能导致统计分析方法的抉择失误,由 此可能得出错误的结论。
该例RR小于1( RR=0.48),可认为试验组(阿 司匹林治疗组)的病死率小于对照组 该例RR的95%可信区间小于1,可以认为阿司匹 林可降低心肌梗死
实例分析2
阿司匹林治疗心肌梗死的效果
OR= ad/bc = 15×90/30×110 =0.409 OR的95%可信区间为:exp㏑(OR)±1.96SE ㏑(OR) =(0.207,0.807) 该例OR的95%可信区间为:(0.207,0.807),该区 间小于1,可以认为阿司匹林可降低心肌梗死
可信区间的主要用途
2、可信区间也可用做假设检验 95%的可信区间与α为0.05的假设检验等价,9 9%的可信区间与α为0.01的假设检验等价
RR和OR的可信区间
RR的95%可信区间为:
exp[㏑(RR)±1.96SE ㏑(RR)]
OR的95%可信区间为:
exp[㏑(OR)±1.96SE ㏑(OR)]
第三节
循证医学中的常用统计指标 及可信区间
一、分类资料的统计指标
分类变量资料的描述指标
常用的率:
发病率、患病率、病死率、死亡率等 EER(试验组事件发生率)、CER(对照组事件发生 率)、率差( RD )
常用的相对比:
相对危险度(RR) 比值比(OR) 相对危险度降低率(RRR) 绝对危险度降低率(ARR) NNT(得到一例有利结果需要防治的病例数) NNH(引起一例副作用需要处理的病例数)
循证医学实践中常用的 统计指标与方法
潘晓放
成都中医药大学第二临床医学院 临床流行病学与循证医学教研室 2010.09
本章要求
掌握 熟悉
了解
常用统计指标的意义及正确使用 可信区间的意义、用途及计算结果解 释 统计方法抉择的基本原则
第一节
医学统计学的概念与主要内容
定义
统计学(statistics)是运用数理统计的 原理和方法,研究数据资料的收集、整理、 分析与推断的科学 将统计学原理与方法应用于医学科学研 究中,就衍生出了医学统计学
3、比值比
比值比(odds ratio,OR )是指病例组某因素的暴露 比值与对照组该因素的暴露比值之比,反映了病例组 某因素的暴露比例为对照组的若干倍。OR是病例对 照研究中描述暴露与疾病联系强度的指标。 在回顾性研究(病例对照研究)中,由于无法计算发 生率、死亡率等率的指标,也就无法计算RR,但可 用OR估计RR 而在前瞻性研究中,当所研究疾病的发病率较小时, 即a和c均较小时, OR与RR的计算结果非常近似 在实际应用中,常用OR估计RR,其结果解释与RR 相同
患病率与发病率的区别
比较项目 分子 获得渠道 患病率 新旧病例总和 横断面调查 发病率 新发病例数 发病报告或队列研究
指标性质
静态指标
动态指标
常用的率
某时期内因某病死亡人数 某病死亡率= —————————————×K 同期平均人口数
某时期内因某病死亡人数 某病病死率= —————————————×100% 同期患某病的人数
RR= P1 / P0
RR可描述暴露组的发病率是非暴露组的多
少倍,常用来表示暴露与疾病联系的强度 及其在病因学上的意义大小
RR的计算
前瞻性研究的数据可由下表表达: RR计算的四格表
组别 试验组 对照组 发病 a(r1) c(r2) 未发病 b d 例数 n1 n2
试验组的发生率 P r1 / n1 RR 1 对照组的发生率 P0 r2 / n2
1、统计描述
统计描述是利用统计指标、统计图或统计 表,对数据资料所进行的最基本的统计分析, 使其能反映样本资料的数量特征及分布规律, 使研究者能准确、全面的了解数据所包涵的信 息,以便对资料做进一步的分析。 统计图表:各类表格或图示 基本指标:均数/标准差;率、构成比