当前位置:文档之家› 第11章 计数资料的统计推断-已经更换模板(李嗣生)

第11章 计数资料的统计推断-已经更换模板(李嗣生)

P
n

式中σP 为率的标准误, 为总体率,n为样本例数, 当总体率不知时可用样本率作总体率的估计值,公式为:
SP P(1 P) n


式中Sp 为率的标准误,P为样本率,n为样本例数。
19:46

例如:某市血液中心对2196名无偿献血者进行 HbsAg检查,结果有138人检出HbsAg阳性,阳性率 6.28%,求标准误,代入公式:
19:46
卡方检验的四种计算方法

x2检验的基本公式:
( A T )2 T
2

四格表专用公式:
(ad bc)2 n (a b)(c d )(a c)(b d )
2

行×列表公式:

配对资料的x2检验:
n( A 1) n R .nC
2
2
(b c) 2 bc
19:4率(或构成比)的假设检验




当两个样本率不同时,有两种可能: (1)P1 , P2所代表的总体率相同,由于抽样误差 的存在,造成的不同,这种差别在统计上叫差别无 统计学意义。 (2) P1 , P2所代表的总体率不同,即两个样本来 不同的总体,其差别有统计学意义。 现在就是要用统计学的方法进行判断到底属于 那种情况。
计算u值:
PC
127 36 0.7309 148 75
u
0.8581 0.4800 0.7309 (1 0.7309 )(1 / 148 1 / 75)
6.015

确定P值:查u界值表,u0.001=3.29,现u>u0.001,差异有极显著性 判断结果:按α=0.05 ,拒绝H0,接受H1 ,可以认为两组有效率 的差别有统计学意义,治疗组治疗效果比对照组好。
19:46
第3节 卡方检验
19:46
x2检验是一种用途较广的假设检验方法,它主要用于计数资料的统计
处理,如用来检验两个率或多个率、两个或多个构成比之间的差别等。
例如:调查1990年某山区不同年龄组蛔虫感染情况,见下表,问两组 的蛔虫感染率有无差别?
某山区不同年龄组蛔虫感染率比较
组别
1~14 15岁以上
2、用以估计总体率的可信区间
当样本含量足够大,且样本率P和(1-P)均不太小,如nP与n(1-P) 均≥5时,样本率的分布近似正态分布,可用正态分布规律估计总体 率的可信区间。公式为: 总体率95%可信区间=P±1.96Sp 总体率99%可信区间=P±2.58Sp
19:46
如上例无偿献血者HBsAg阳性率为6.28 %,标准误为0.52%,则所有无偿献血 者HBsAg总体率的95%和99%可信区 间为: 总体率95%可信区间= 6.28%±1.96×0.52% = 5.26%~7.30% 总体率99%可信区间= 6.28%±2.58×0.52% = 4.94%~7.62% 3、用于率的假设检验:见计数资料 的假设检验(如率的u检验)。两率差 异的假设检验。
2
本例 3.84<5.46<6.63 ,故0.05<P<0.01 ,差异有极显著性

判断结果:按α=0.05 水准,拒绝H0 ,接受H1 ,可以认为两组抗HCV阳性率有差别,性乱者抗-HCV阳性率高于献血员。
19:46
四格表专用公式
公式为:
2 ( ad bc ) n 2 (a b)(c d )(a c)(b d )

2
( A T 0.5) T
2
( ad bc n ) 2 n 2 2 (a b)(c d )(a c)(b d )
19:46

例11.8 某地对甲、乙两零售点的猪肉进行抽查,检查其表层沙门氏菌带菌情况如下表。 试问甲、乙两零售点的猪肉表层沙门菌带菌率有无差别? 甲、乙两零售点猪肉表层沙门菌的带菌率 采样地点 阳性例数 阴性例数 合计 带菌率(%) 甲两零售点 2 26 28 7.14 甲两零售点 5 91 43 5.71 合 计 7 35 42 16.67
19:46
表11-3-2 两组抗-HCV阳性率比较 组别 + - 合计
性乱者
献血员 合计
18(13.21)
2( 6.79) 20
190(194.79)
105(100.21) 295
208
107 315
检验步骤: 建立假设:H0: π1 =π2

H1: π1 ≠π2
α=0.05
计算各格子理论数:
式中 P 为样本率,σP为总体率的标准误,π0为已知的 总体率,n为样本含量。
19:46
例11.5 某病的年发病率对全国人口来说为8.72%。现 在某县回顾一年,抽样调查了120人,有16人发该病。 问该县该病的发病率是否高于全国该病的发病率?

建立假设:H0:π =π0 , α=0.05 计算u值:u=
• •
计算x2值:
确定P值: υ =(行数-1)(列数-1)=(2-1)(2-1)=1
x20.05,1= 3.84, x20.01,1=6.63
(18 13.21) 2 (190 194.79) 2 (2 6.79) 2 (105 100.21) 2 5.4627 13.21 194.79 6.79 100.21
0.0628 (1 0.0628 ) SP 0.52% 2196
19:46
率的标准误的应用
1、表示抽样误差的大小
率的标准误小,说明抽样误差小,表示样本率与总体率越接近, 用样本率推断总体率的可靠性越大。反之,率的标准误越大,表示 样本率离总体率较远,用样本率推断总体率的可靠性小。医学文献 上常用P±SP表示资料的可靠性。 例如,上例样本率的可靠性可表示为 6.28%±0.52%。
TRC
n R nC n
TRC式中为行与列的格子内理论数,nR为相应行的合计数,nC为相应列 的合计数。 208 20 第1行第1列格子的T: T11 13.21 315
第1行第2列格子的T: T 12=208-13.21=194.79
19:46
第2行第1列格子的T: T 21=20-13.21=6.79 第2行第2列格子的T: T 22=107-6.79=100.21 因为表中每行每列的合计是固定的,只要求得其中一格理论数,其余三格 可利用同行或同列的合计数相减而求出。
2
19:46
卡方检验的基本公式
x2检验的基本公式: 2
( A T )2 T
检验的基本思想:公式中A为实际观察值,T为理论值, 它是根据检验假设来确定的,假设各样本率或比所属总体 的率或比相同(H0)。如果这一假设成立,则各样本率或比 就应该比较接近,实际数和理论数就不会相差太大,计算 的x2值就比较小;反之计算的x2值就大。因此, x2值反映 了实际数与理论数吻合的程度,但是x2值的大小,除决定 于A-T的差值外,还取决于格子数(严格说是自由度)的多 少,因为各格的(A -T)2/T 都是正值,故格子数越多, x2 值也越大。只有排除了这种影响, x2值才能正确反映A 和 T 的吻合程度,所以在查 x2 值表时必须考虑自由度的大小。

式中a、b、c、d分别代表四个格子的实际数, 现仍以例为例11.7 ,见表11-3-2 ,代入公式:
(18105- 190 2)2 315 5.4627 (18 190)(2 105)(18 2)(190 105)
2
计算结果与基本公式一致。
19:46
四格表校正公式

应用基本公式和四格表资料专用公式的条件是n≥40,且 T≥5。当n≥40,但1≤T<5时,应使用校正公式,否则会使卡 方值偏大而造成结论错误。 校正公式:
19:46
第11章
计数资料的统计推断
19:46
第11章 计数资料的统计 推断
学习目标 1.掌握率的抽样误差、率的标准误的概 念, 计数资料的U检验的方法及应用条件 2.熟悉率的标准误的计算和用途 3.了解率的u检验的方法和应用条件
19:46
主要内容
一、率(或构成比)的抽样误差和标准误 二、总体率(或构成比)的估计:点估计、区 间估计 三、总体率(或构成比)的假设检验 1. 率(或构成比)的 检验 2. x2检验 四、假设检验的注意事项
建立假设:H0: π1 =π2 H1: π1 ≠π2 α=0.05 计算各格子理论数(见表中): 计算x2值:本例有两个格子的理论数小于5,且n>40,故应用校正公式:

2
( 2 9 26 5 42/2)2 42 2814 7 35
3.62
确定P值: υ=(2-1)(2-1)=1 , x20.05,1= 3.84 3.62 <3.84, 故P>0.05 差异无显著性
H1:π ≠π0
1.79

0.1333 0.0872 0.0872 (1 0.0872 ) / 120
确定P值:本例 1.79<1.96 , 故P>0.05 , 差异无显著 性。 判断结果:按α=0.05 水准,拒绝H0,接受H1,可 以认为某县该病的发病率与全国该病的发病率没有差 别。
19:46
两个样本率的比较

计算公式如下:
u
PC
p1 p2 S P1 P2
X1 X 2 n1 n2

p1 p2
pc (1 pc )(1 / n1 1 / n2 )
S P1 P2
式中P1 、P2为样本率,SP 1-P 2 为两样本率之差的标 准误 ,PC为合并样本率,n1和n2 分别为两样本含量, X1和X2分别为两样本的某类发生数。
2 ( b c ) 2 bc
当b+C<40时:
相关主题