当前位置:
文档之家› 计数资料的统计描述及卡方检验
计数资料的统计描述及卡方检验
一、计数资料的统计描述方法
(一)图表: 频数表,直条图,饼图
变量类型的判断
病例号
1 2 3 4 5 6 7 8 9
年龄 (岁)
35 44 26 25 41 45 50 28 31
性别
身高 (m)
血型
心电图
尿WBC
女 1.65 A
正常
-
男 1.74 B
正常
-
男 1.80 O
正常
+
女 1.61 AB 正常
率又包括频率指标(frequency)和强度指标 (rate),用来测量一定时期内,某人群特 定事件发生的频率或强度。
• 率=(发生某现象的观察单位数)/(某时间段 可能发生某现象的观察单位数)
• 常用百分率(感染率)、千分率、10万分 率(肿瘤发病率)表示。
✓率是一个动态指标,在观察期内看特定人群 中某事件的变化。
治疗组 90
10 100 0.1
对照组 80
20 100 0.2
某种抗生素预防院内感染的疗效分析
本例OR=0.44。
OR、RR临床(实际)意义
• OR、RR>1,表明暴露因素为危险因素,偏 离1越远,表示危险性越强
• 0<OR、RR<1,表明暴露因素为保护因素, 离0越近,表示保护性越强
• OR、RR=1,表明暴露因素与结果无关
–是一个静态指标
–无时间单位
3、相对比 (ratio)
相对比是A、B两个指标之比,是比较两独立事件数 量大小关系指标(独立指互不包含):比=A/B
– 两个指标可性质相同,可不同;绝对数、相对数或平均数。 – 是一个静态指标,反映一特定时间(time point)的情况。 – 无时间单位
计数资料的统计描述:率与比的综合应用 例1 某医院院内感染汇总分析
60
40
轻 100 5
5% 1000 100
50
合计 1100 185 16.8% 1600 220 110
计算标准化感染比(SIR)=(实际感染数与预期感
染数比)=220/110=2;SIR<1, 表示被标化组的感染 率低于标准组; SIR>1, 表示被标化组的感染率高 于标准组。
2、标准化率的注意事项
月份 1月份 2月份 3月份 4月份 5月份 6月份 合计
出院人数 584 571 714 748 942 1095
感染人数 8 10 12 16 21 24 91
感染率 1.37 1.75 1.68 2.14 2.23 2.19
构成比 8.8 11.0 13.2 17.6 23.0 26.4
相对比 -1.28 1.23 1.56 1.63 1.60
注意:暴露因素和结果的赋值标准化:1表示暴露, 0表示未暴露;1表示感染,0表示未感染。否则结 论可能刚好相反。
相对危险度与比数比的关系
例6:治疗组感染率=10/100=0.1;对照组感染率0.2
RR=0.5 OR=0.44
例7:治疗组感染率=5/100=0.05;对照组感染率 =10/100=0.1
绝对危险度实例计算
• 对于感染率研究: 绝对危险度为:20%-10%=0.1 (常用百分数表示:10%)
• 治疗能使感染率的危险度减少10%左右
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR)
* 二分类变量: 0,1
* 有序多分类:多采用等间距赋值
如 -、+、++、+++(0、1、2、3)
* 少量非线性关系有序多分类赋值:考虑哑变量
* 无序多分类变量赋值: A、B、AB、O
12
3
4?
采用哑变量方法:dummy variable
革阳菌的哑变量赋值为(1,0,0),革阴菌哑变量 赋值为(0,1,0),真菌哑变量赋值为(0,0,1)
例4 甲、乙两个医院感染率比较
病情程度
甲医院
乙医院
例数 感染数 感染率 例数 感染数 感染率
重 800 160
20% 100 30 30%
中 200
20
10% 400 60 15%
轻 100
5
5% 1000 100 10%
合计 1100 185 16.8% 1500 190 12.7%
1、标准化法的基本方法
计数资料的分类
• 无序分类: 二项或二分类:对立、不相容的两类。 如疗效:病死与未愈,感染与否等。 多项或多分类:互不相容的多类。 如感染部位、感染分型等
• 有序分类:类间不相容且有程度差别。 如疗效:痊愈、显效、好转、无效。
特点:无度量衡单位;定性测量
计数资料的分类赋值
在赋值时应考虑类型而定。
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT)
• 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类:
<5mmHg
无效
5-10mmHg
有效
10-20mmHg
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
RR=0.5 OR=0.48
• 当率较低,如小于10%时, RR值与OR值近似相等。 率值越小(罕发事件),越接近。
• 对大规模临床随机对照试验:OR、RR可使用。
3、绝对危险度(率差)
•对照组感染率40%,试验组20%,RR=0.5? •对照组感染率10%,试验组5%,RR=0.5?
AR为两个率的绝对差值:即对照组率-治 疗组率
轻 100 5
5% 100 10
合计 1100 185 16.8% 1100 280
30% 15%
10% 12.7%
25.4%
2)、间接法:分组标准率
病情程度
甲医院
乙医院
例数 感染数 感染率 例数 实际 预期 感染数 感染数
重 800 160 20% 100
30
20
中 200 20 10% 400
✓率有时间单位—观察时间影响率的大小。
反应停销售量 畸形儿发生率
与医院感染有关的率
• 医院感染发生率 • 医院感染罹患率 • 医院感染患病率(即现患率)
医院感染发生率
• 是指一定时间内某人群中新发病例的频率。
– 公式=(同一时期内新发生医院感染例数/同一时期内处于 危险中病人数)×100%
– 或公式=(同期新发生医院感染例数/同期住院病人人数或 出院病人数)×100%
0.5 0 工人 干部 职员 军人 农民 教师
直条图(bar 条形图):分类变量资料的频数图, 条与条间独立,顺序可不固定。与Histgram不同
饼图/圆饼图/圆图/pie图
百分条图 (percent bar)
工人
干部
1
职员
军人
农民
教师
0%
50%
100%
(二)率、比 (构成比、相对比)
1、率 (rate, frequency)
(三)、计数资料统计描述的 注意事项
1. 计算率时要求分母不宜过小。少于10 例则直接描述。
例2 血清TPS检出率与消化道肿瘤淋巴结转移关系
肿瘤
淋巴结转移
n TPS 阳性率
食管癌 7
7
100
胃癌 9
6
66.7
大肠癌 10
7
70.0
合计 26 20
76.9
(7/7),(6/9),7/10,0/1
无淋巴结转移
实例(例5)分析
组别 未感染 感染 合计 感染率
治疗组 90
10 100 0.1
对照组 80
20 100 0.2
某种抗生素预防院内感染的疗效分析。
RR计算的实例演示
• 治疗组发生感染的危险度(率) =10/100=0.10
• 对照组发生感染的危险度(率) =20/100=0.20
• 相对危险度(RR)=0.5
部分原始数据
9名感染病例的职业状况
编号
性别
身高 职业状况
1
女
1.65
教师
2
男
1.74
工人
3
男
1.80
职员
4
女
1.61
农民
职业状况 工人 干部 职员
频数 3 2 1
5
男
1.71
工人
6
女
1.58
工人
7
女
1.60
干部
8
男
1.76
干部
9
女
1.62
军人
军人
1
农民
1
教师
1
合计
9
2、直条图
3.5 3
2.5 2
1.5 1
• 率与比可用来描述某事件发生机会的大小。
• 二分类变量资料描述
–相对危险度(RR)与比数比(OR)是用来描述 两组间事件发生的机会之比。
• 当事件的发生机会较大时,RR与OR相差较大;当为罕 发事件时, RR OR。
–绝对危险度是指率差,NNT为避免一例不良事件 发生而需要治疗的病例数。
二、计数资料的假设检验
✓条件:比较双方应同质、同时、同地,比较 的两组应选用同一标准。
✓标准选用不同,标化率可不同。标准化率只 是两组的相对水平,不反映实际的情况,只 能用于比较。
✓总体标准化率比较也需进行假设检验。
(五)以率/比基础的二级指标
• 相对危险度(RR) • 比数比(OR) • 绝对危险度(AR) • NNT 用来表达危险度的大小或关联程度