当前位置:
文档之家› 医学统计学课件:08 分类资料的统计推断
医学统计学课件:08 分类资料的统计推断
u p1 p2 s p1 p2
pc
n1 N1
n2 N2
p1 p2
pc
1
pc
1 n1
1 n2
Page 13
两样本率比较的2检验
➢ 读作 chi 2 :卡方 ➢ 2检验(chi-square test) 是现
代统计学的创始人 Karl Pearson(1857-1936 )于1900 年提出的一种具有广泛用途 的统计方法 。
sp 0.0903(1 0.0903 ) / 144 0.0239 2.39%
• 95%可信限为:9.03%±1.96×2.39% • 即该地人群的乙型肝炎表面抗原阳性率的95%可信区间
为:4.35%~13.71%。
样本率与总体率的比较
目的: 推断该样本所代表的未知总体率与已知的总 体率是否不等。
43
10
40
16
理论数T
40.36 12.64 42.64 13.36
2检验的基本思想(2)
• 如果H0假设成立,则实际频数与理论频数应
该比较接近。差值A T 属于随机误差,用2
统计量表示:
2
( A T )2 ~ 2分布
T
H0成立时,实际数与理论数的差别不会很大,出现较大2值概率很小。 如果实际频数与理论频数相差较大, 2检验统计量超出了界值,则拒绝H0 。
p u s p
总体率的区间估计 (二)
• 总体率( )95%的可信区间为:
p 1.96s p
• 总体率( ) 99%的可信区间为:
p 2.58s p
例6.2
• 从某地人群中随机抽取144人,检查乙型肝炎表面抗原 携带状况,阳性率为9.03%,求该地人群的乙型肝炎表 面抗原阳性率的95%可信区间。
分类资料的统计推断
内容提要
➢ 率的标准误及区间估计 ➢ 样本率与总体率的比较
➢ 两样本率比较的2检验
➢ 多组率或者构成比的比较 ➢ 配对两分类资料的假设检验 ➢ Fisher精确概率法
简要回顾
分定类量资料
Example
统计描述
统计分析
参数估计 统计推断
假设检验
均率、数比、、标构准成差比 总体率均的数可的信可区信间区间
例6.1
• 有人调查29名非吸毒妇女,出狱时有1名HIV阳 性,试问HIV阳性率的95%的可信区间是多少?
• 本例 n=29,X=1,查附表7得0.1~17.8,即该HIV 阳性率的95%的可信区间为:0.1%~17.8%。
总体率的区间估计 (二)
正态近似法
– n足够大,p与1-p不太小,如np>5和n(1-p)>5 样本率p的抽样分布近似正态分布。
若P≤ ,则拒绝H0; 若P> ,则尚无理由拒绝它。
第一步:建立检验假设
➢H0:两总体有效率相等,即1=2; ➢H1:两总体有效率不等,即12。
第二步:确定检验水准
➢ = 0.05 (双侧检验)
第三步:计算检验统计量
2 (AT)2
T
式中: A 为实际频数(actual frequency) T 为理论频数(theoretical frequency)
n 较大时,正态近似法
p
u
n 较小时,直接计算概率法
p (1 )
n
6.3 两样本率的比较
➢目的: 推断两总体率是否不等 ➢两样本率比较的u 检验(u test)
➢两样本率比较的2检验 (chi-square test)
两样本率的比较的u 检验
– 正态近似法
当n1, n2均较大,p1, p2, (1-p1), (1-p2)均不太小, 如n1p1, n2p2, n1(1-p1), n2(1-p2)均大于5时,可用u 检验。
✓在这样的假设前提下,可以计算各组理论 频数(theoretical frequency) T。
理论频数的计算
理论频数=53 76.15%
处理 试验组
有效 人数
理论 频数
无效 人数
理论 频数
合计 有效率 (%)
43 40.36 10 12.64 53 7861..1153
对照组 40 42.64 16 13.36 56 7761..1453
合计 83
26
109 76.15
Trc
nr nc n
理论频数=56 76.15%
四格表的理论频数由下式求得 :
nn
TRC
RC
n
式中:TRC为第R 行C 列的理论频数, nR为相应的行合计, nC为相应的列合计。
2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反 映两样本率的差别!
实际数A
组别
有效 无效 合计 有效率(%)
试验组
43(a) 10(b) 53 81.13
对照组
40(c) 16(d) 56 71.43
合计
83
26 109 76.15
四格表 (fourfold table)
理论频数 (theoretical frequence)
✓如果两个样本来自同一总体,则两组有效 率相同,则用合计的有效率作为总体率估 计值。
组别 试验组 对照组
合计
表6.2 表6.1资料理论频数的计算
有效 40.36 42.64
83
无效 12.64 13.36
26
合计 53 56 109
T11=53×83/109=40.36;T12=53×Байду номын сангаас6/109=12.64 T21=56×83/109=42.64;T22=56×26/109=13.36。
例 6.5
➢ 某医师在用蛙王露口服液治疗贫血的临床试验 中,将109名受试者随机分为两组,一组为试 验组,接受蛙王露口服液的治疗,结果为有效 43人,无效10人;另一组为对照组,接受复方 阿胶浆的治疗,结果为有效40人,无效16人, 问两组有效率有无差别?
例6.5
表 6.1 两药治疗贫血有效率的比较
衡量理论数与实际数的差别
2 ( A T )2
T
2 43 40.362 10 12.642 40 42.642 16 13.362 1.41
40.36
12.64
42.64
13.36
第四步:确定 P 值,下结论
表 四格表资料的基本形式
χt检2验检验
率的抽样误差
• 由于总体中个体变异的存在,在抽样过 程中产生的样本率与总体率的差异或样 本率间的差异 ,称为率的抽样误差。
率的标准误(SE of Rate)
• 率的抽样误差大小的衡量指标
1
p
n
p1 p
sp
n
总体率的区间估计 (一)
查表法
– n较小,如n≤50,特别是p接近0或1时 – 用样本含量n与阳性数X查附表7