当前位置:
文档之家› 计数资料的统计描述与统计推断
计数资料的统计描述与统计推断
2 nnARn2C 1
(一) 多个样本率的比较:
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某 成同 年 比年 某死 类亡 死总 因人 死 1数 亡 0% 0人数
8
(二)疾病统计指标
某 病 发病 一率 定 该时 期期 间内 新可 病 发能 的 生 例发 平 的 数生 均 某 某 人 K病
某病患病率 某该时时点点某受病检现人患口病 K数例数
某
病
病死同 因率期 某某 病
死亡人数 病病 10人 % 0 数
29
31
(三)四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3
27
14.6
9
14.3
49
4.5
10
第六章 二项分布(简介)
率的抽样分布 率的抽样误差与标准误 总体率的估计 两个率比较的u检验
14
一、率的抽样分布
从一个阳性率为π的总体中,随机抽取含量为 n的样本,则样本中阳性数X或阳性率p服从二项分 布( binomial distribution )。
SP
n
0.0156 329
0 . 0 1 . 9 8 0 . 0 6 8 0 . 0 1 ~ 1 0 . 1 5 5 5 . 7 1 7 6 % ~ 1 . 5 8 8 5 %
故该地人群血清登革热血凝抑制抗体阳性率的95%可 信区间为5.75%~11.87%。
20
四、率的u检验
应用条件??? (一)样本率与总体率的比较
28
组别 铅中毒病人
对照组 合计
两组人群尿棕色素阳性率比较
阳性数
阴性数
合计
29(18.74) 7(17.26)
36
9(19.26)
28(17.74)
37
38
35
73
阳性率(%) 80.56 24.32 52.05
χ2值大小除与 |A-T| 有关外,还取决于自由度ν。 ν=(R-1)(C-1) 不同自由度有不同的X2分布曲线 (3)确定P,作出统计推断结论:根据自由度ν查χ 2界值表, 确定P。本例ν=1,查表得P<0.005。按α=0.05 水准拒绝 H0,接受H1,可认为两总体阳性率不等,铅中毒病人有尿棕 色素增高现象。
(2)正态近似法: np和n(1-p) 5
Pu/2SP
P 1.96SP P 2.58SP
19
例 在某地随机抽取329人,作血清登革热血凝抑制 抗体反应检验,结果29人阳性,估计该地人群血清登 革热血凝抑制抗体阳性率。
p 29 0.0881 329
p(1p) 0.08 (1 10.08 ) 1
40
(三) 分类资料的关联性检验——列联表的相关分析
例7-8
ABO血型
O A B AB 合计
某地5801人的血型
MN血型
M
N
MN
431 490 902
388 410 800
495 587 950
137 179
32
1451 1666 2684
合计
1823 1598 2032 348 5801
问:两种血型系统之间是否有关联?
PC (2313)/(8085)0.2182
u
0.28750.1529
2.09
0.218(120.218)(2180185)
22
第七章 χ2检验 chi square test
23
一、用途:
1.率或构成比的假设检验 2.两分类变量间的相关分析 3.其它
24
两个率比较
1、成组设计——四格表χ2检验或四格表确切概率法 2、配对设计——配对四格表χ2检验
u P (1) n
(二)两个样本率的比较
u
p1p2
pc(1pc)1 (n11n2)
pc
X1 n1
X2 n2
21
例1:据以往经验,一般胃溃疡患者有20%发生胃出血症状。现 某医院观察65岁以上溃疡病人304例,有31.6%发生胃出血症状, 问老年胃溃疡患者是否较容易出血?
H0: = 0 H1: > 0
直接用2检验。
(2)1 T 5,而且N 40 校正2检验。
(3)T 1 或N 40,
不能用2检验。
• 注意:上述条件是以理论数为依据,而非实际数。
34
三.配对资料2检验
(一)应用条件与计算公式
bc 40
2 bc2
bc
bc 40
2 bc 1 2 bc
甲种属性
乙种属性
合计
+
-
+
a
b
a+b
2
(一)率(rate)
说明某种现象发生的频率或强度。
率可 某能 现发 象生 实该 际 比 现 发 例 象 生 基 的 A 数 A 数 总 A 数 K K为比例基数,其确定原则为: (1)习惯用法; (2)保留1~2位整数。
3
(二)构成比(proportion)
说明某一事物内部各组成部分所占的比重或分布。
-
c
d
c+d
合计
a+c
b+d
n
35
(二)例: 某研究室用甲、乙两种血清学方法检查410例确诊
的鼻咽癌患者,得结果如下,问两法检出率有无差别?
甲法
+ - 合计
两种血清学检验结果
乙
法
+
-
261
110
8
31
269
141
合计
371 39 410
36
H0: 两法检出率相等 ,B = C H1: 两法检出率不等, B≠C
PC
X1X2 X3 n1n2 n3
(4)注意可比性
(5)样本率或样本构成比的比较需假设检验
(6)若两个总率比较,其内部构成不同,并能影响其结 果,需进行率的标准化。
7
四.医学中常用的相对数指标
(一)死亡统计指标
死亡率
某年死亡总数 同年年平均人口数
1000
0
00
年龄别死亡 同 某率 年 年同 某年 年龄 龄年 组数 平 死 1均 亡 00人 0人 000 口 数 某病死亡 同 某专 年 年率 年 某平 病均 死 10人 亡 00口 1人 00万 0数 数
治愈率 治 受愈 治病 病人 人 10数 数 % 0
9
抽样调查某企业2839名职工高血压病,结果如下表。据此,
某医生认为(1)该企业单位高血压发病率为8%,并随年龄递增,
其中40岁以上患者占全部病例的90.3%,60岁以上者发病率为
100%。(2)高血压发病与性别有关,男性为10.2%,女性为4.5%,
多个率比较
两个或多个构成比比较
R×C表χ2检验
两个分类变量的关联性分析
25
二、四格表资料的χ2检验
——两个样本率比较 (一)什么是四格表资料? 例:为了解铅中毒病人是否有尿棕色素增加现象,
分别对病人组和对照组的尿液作尿棕色素定性 检查,如表,问铅中毒病人与对照人群的尿棕 色素阳性率有无差别?
26
组别
2 (AT)2
T
Pearson 2值
A 实 际 频 数即 表 中 的4个 基 本 数 据
T-理论频数
TRC
nR nC n
3638
T11
18.74 73
本例
22-1 98 2 .7 7 -1 47 2 .2 9 -1 69 2 .2 2-6 1 87 2 .2 7.1 3 42 1.7 84 1.2 76 1.2 96 1.7 74
39
(二)多个构成比的比较
地区
三个不同地区血型构成比比较
A
B
AB
O 合计
亚洲 321 369 95 295 1080
欧洲 258 43
22 194 517
北美洲 408 106 37 444 995
合计 987 518 154 933 2592
χ2=297.59 ν=(3-1)(4-1)=6 P<0.005
单侧 = 0.05
u 0.3160.20 5.06 0.2(10.2) 304
例2:为研究某地男女学生的肺吸虫感染率是否存在差别,某 研究者随机抽取该地80名男生和85名女生,查得感染人数男生 23人,女生13人。请作统计分析。
H0: 1 = 2 H1: 1≠ 2 = 0.05
P1 23/800.2875 P2 13/850.1529
构
成比 同
某一 组成部 分 位的 数观 察单 一 事物各 组 观成 察部 单分 位 1的 总 0% 0数
A 10% 0