当前位置：文档之家› 医学统计学课件：08 分类资料的统计推断

医学统计学课件：08 分类资料的统计推断

u p1 p2 s p1 p2
pc
n1 N1
n2 N2
p1 p2
pc
1
pc
1 n1
1 n2
Page 13
两样本率比较的2检验
➢ 读作 chi 2 ：卡方 ➢ 2检验(chi-square test) 是现
代统计学的创始人 Karl Pearson(1857-1936 )于1900 年提出的一种具有广泛用途的统计方法。
sp 0.0903(1 0.0903 ) / 144 0.0239 2.39%
• 95%可信限为：9.03%±1.96×2.39% • 即该地人群的乙型肝炎表面抗原阳性率的95%可信区间
为：4.35%~13.71%。
样本率与总体率的比较
目的: 推断该样本所代表的未知总体率与已知的总体率是否不等。
43
10
40
16
理论数T
40.36 12.64 42.64 13.36
2检验的基本思想(2)
• 如果H0假设成立，则实际频数与理论频数应
该比较接近。差值A T 属于随机误差，用2
统计量表示：
2
( A T )2 ~ 2分布
T
H0成立时，实际数与理论数的差别不会很大，出现较大2值概率很小。如果实际频数与理论频数相差较大, 2检验统计量超出了界值,则拒绝H0 。
p u s p
总体率的区间估计 (二)
• 总体率( )95%的可信区间为：
p 1.96s p
• 总体率( ) 99%的可信区间为：
p 2.58s p
例6.2
• 从某地人群中随机抽取144人，检查乙型肝炎表面抗原携带状况，阳性率为9.03%，求该地人群的乙型肝炎表面抗原阳性率的95%可信区间。
分类资料的统计推断
内容提要
➢ 率的标准误及区间估计 ➢ 样本率与总体率的比较
➢ 两样本率比较的2检验
➢ 多组率或者构成比的比较 ➢ 配对两分类资料的假设检验 ➢ Fisher精确概率法
简要回顾
分定类量资料
Example
统计描述
统计分析
参数估计统计推断
假设检验
均率、数比、、标构准成差比总体率均的数可的信可区信间区间
例6.1
• 有人调查29名非吸毒妇女，出狱时有1名HIV阳性，试问HIV阳性率的95%的可信区间是多少？
• 本例 n=29，X=1，查附表7得0.1~17.8，即该HIV 阳性率的95%的可信区间为：0.1%~17.8%。
总体率的区间估计 (二)
正态近似法
– n足够大，p与1-p不太小，如np>5和n(1-p)>5 样本率p的抽样分布近似正态分布。
若P≤ ，则拒绝H0；若P＞，则尚无理由拒绝它。
第一步：建立检验假设
➢H0：两总体有效率相等，即1=2； ➢H1：两总体有效率不等，即12。
第二步：确定检验水准
➢ = 0.05 (双侧检验)
第三步：计算检验统计量
2 (AT)2
T
式中： A 为实际频数（actual frequency） T 为理论频数（theoretical frequency）
n 较大时，正态近似法
p
u
n 较小时，直接计算概率法
p (1 )
n
6.3 两样本率的比较
➢目的: 推断两总体率是否不等 ➢两样本率比较的u 检验(u test)
➢两样本率比较的2检验 (chi-square test)
两样本率的比较的u 检验
– 正态近似法
当n1, n2均较大，p1, p2, (1-p1), (1-p2)均不太小，如n1p1, n2p2, n1(1-p1), n2(1-p2)均大于5时，可用u 检验。
✓在这样的假设前提下，可以计算各组理论频数(theoretical frequency) T。
理论频数的计算
理论频数＝53 76.15%
处理试验组
有效人数
理论频数
无效人数
理论频数
合计有效率 (%)
43 40.36 10 12.64 53 7861..1153
对照组 40 42.64 16 13.36 56 7761..1453
合计 83
26
109 76.15
Trc
nr nc n
理论频数＝56 76.15%
四格表的理论频数由下式求得：
nn
TRC
RC
n
式中：TRC为第R 行C 列的理论频数， nR为相应的行合计， nC为相应的列合计。
2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反映两样本率的差别!
实际数A
组别
有效无效合计有效率(%)
试验组
43(a) 10(b) 53 81.13
对照组
40(c) 16(d) 56 71.43
合计
83
26 109 76.15
四格表（fourfold table）
理论频数 (theoretical frequence)
✓如果两个样本来自同一总体，则两组有效率相同，则用合计的有效率作为总体率估计值。
组别试验组对照组
合计
表6.2 表6.1资料理论频数的计算
有效 40.36 42.64
83
无效 12.64 13.36
26
合计 53 56 109
T11=53×83/109=40.36；T12=53×Байду номын сангаас6/109=12.64 T21=56×83/109=42.64；T22=56×26/109=13.36。
例 6.5
➢ 某医师在用蛙王露口服液治疗贫血的临床试验中，将109名受试者随机分为两组，一组为试验组，接受蛙王露口服液的治疗，结果为有效 43人，无效10人；另一组为对照组，接受复方阿胶浆的治疗，结果为有效40人，无效16人，问两组有效率有无差别?
例6.5
表 6.1 两药治疗贫血有效率的比较
衡量理论数与实际数的差别
2 ( A T )2
T
2 43 40.362 10 12.642 40 42.642 16 13.362 1.41
40.36
12.64
42.64
13.36
第四步：确定 P 值，下结论
表四格表资料的基本形式
χt检2验检验
率的抽样误差
• 由于总体中个体变异的存在，在抽样过程中产生的样本率与总体率的差异或样本率间的差异，称为率的抽样误差。
率的标准误(SE of Rate)
• 率的抽样误差大小的衡量指标
1
p
n
p1 p
sp
n
总体率的区间估计 (一)
查表法
– n较小，如n≤50，特别是p接近0或1时 – 用样本含量n与阳性数X查附表7

e商务文档

医学统计学课件：08 分类资料的统计推断

相关文档推荐：