当前位置：文档之家› 第11章计数资料的统计推断-已经更换模板(李嗣生)

第11章计数资料的统计推断-已经更换模板(李嗣生)

P
n

式中σP 为率的标准误，为总体率，n为样本例数，当总体率不知时可用样本率作总体率的估计值，公式为：
SP P(1 P) n

式中Sp 为率的标准误，P为样本率，n为样本例数。
19:46

例如：某市血液中心对2196名无偿献血者进行 HbsAg检查，结果有138人检出HbsAg阳性，阳性率 6.28%，求标准误，代入公式：
19:46
卡方检验的四种计算方法

x2检验的基本公式：
( A T )2 T
2

四格表专用公式：
(ad bc)2 n (a b)(c d )(a c)(b d )
2

行×列表公式：

配对资料的x2检验：
n( A 1) n R .nC
2
2
(b c) 2 bc
19:4率（或构成比）的假设检验

当两个样本率不同时,有两种可能: （1）P1 , P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义。（2） P1 , P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。现在就是要用统计学的方法进行判断到底属于那种情况。
计算u值：
PC
127 36 0.7309 148 75
u
0.8581 0.4800 0.7309 (1 0.7309 )(1 / 148 1 / 75)
6.015

确定P值：查u界值表，u0.001=3.29，现u＞u0.001，差异有极显著性判断结果：按α=0.05 ，拒绝H0，接受H1 ，可以认为两组有效率的差别有统计学意义，治疗组治疗效果比对照组好。
19:46
第3节卡方检验
19:46
x2检验是一种用途较广的假设检验方法，它主要用于计数资料的统计
处理，如用来检验两个率或多个率、两个或多个构成比之间的差别等。
例如：调查1990年某山区不同年龄组蛔虫感染情况，见下表，问两组的蛔虫感染率有无差别？
某山区不同年龄组蛔虫感染率比较
组别
1～14 15岁以上
2、用以估计总体率的可信区间
当样本含量足够大，且样本率P和(1－P)均不太小，如nP与n(1-P) 均≥5时，样本率的分布近似正态分布，可用正态分布规律估计总体率的可信区间。公式为：总体率95％可信区间＝P±1.96Sp 总体率99％可信区间＝P±2.58Sp
19:46
如上例无偿献血者HBsAg阳性率为6.28 ％，标准误为0.52%，则所有无偿献血者HBsAg总体率的95%和99%可信区间为：总体率95％可信区间＝ 6.28%±1.96×0.52% ＝ 5.26%~7.30% 总体率99％可信区间＝ 6.28%±2.58×0.52% ＝ 4.94%~7.62% 3、用于率的假设检验：见计数资料的假设检验（如率的u检验）。两率差异的假设检验。
2
本例 3.84<5.46<6.63 ,故0.05<P<0.01 ,差异有极显著性
•
判断结果：按α=0.05 水准，拒绝H0 ，接受H1 ，可以认为两组抗HCV阳性率有差别，性乱者抗-HCV阳性率高于献血员。
19:46
四格表专用公式
公式为：
2 ( ad bc ) n 2 (a b)(c d )(a c)(b d )

2
( A T 0.5) T
2
( ad bc n ) 2 n 2 2 (a b)(c d )(a c)(b d )
19:46

例11.8 某地对甲、乙两零售点的猪肉进行抽查，检查其表层沙门氏菌带菌情况如下表。试问甲、乙两零售点的猪肉表层沙门菌带菌率有无差别？甲、乙两零售点猪肉表层沙门菌的带菌率采样地点阳性例数阴性例数合计带菌率（%）甲两零售点 2 26 28 7.14 甲两零售点 5 91 43 5.71 合计 7 35 42 16.67
19:46
表11-3-2 两组抗-HCV阳性率比较组别＋－合计
性乱者
献血员合计
18(13.21)
2( 6.79) 20
190(194.79)
105(100.21) 295
208
107 315
检验步骤：建立假设：H0： π1 =π2

H1： π1 ≠π2
α=0.05
计算各格子理论数：
式中 P 为样本率，σP为总体率的标准误，π0为已知的总体率，n为样本含量。
19:46
例11.5 某病的年发病率对全国人口来说为8.72%。现在某县回顾一年，抽样调查了120人，有16人发该病。问该县该病的发病率是否高于全国该病的发病率？

建立假设：H0：π =π0 ， α=0.05 计算u值：u=
• •
计算x2值：
确定P值： υ ＝(行数－1)(列数－1)＝(2－1)(2－1)＝1
x20.05,1= 3.84, x20.01,1=6.63
(18 13.21) 2 (190 194.79) 2 (2 6.79) 2 (105 100.21) 2 5.4627 13.21 194.79 6.79 100.21
0.0628 (1 0.0628 ) SP 0.52% 2196
19:46
率的标准误的应用
1、表示抽样误差的大小
率的标准误小，说明抽样误差小，表示样本率与总体率越接近，用样本率推断总体率的可靠性越大。反之，率的标准误越大，表示样本率离总体率较远，用样本率推断总体率的可靠性小。医学文献上常用P±SP表示资料的可靠性。例如，上例样本率的可靠性可表示为 6.28%±0.52%。
TRC
n R nC n
TRC式中为行与列的格子内理论数，nR为相应行的合计数，nC为相应列的合计数。 208 20 第1行第1列格子的T: T11 13.21 315
第1行第2列格子的T: T 12=208-13.21=194.79
19:46
第2行第1列格子的T: T 21=20-13.21=6.79 第2行第2列格子的T: T 22=107-6.79=100.21 因为表中每行每列的合计是固定的，只要求得其中一格理论数，其余三格可利用同行或同列的合计数相减而求出。
2
19:46
卡方检验的基本公式
x2检验的基本公式： 2
( A T )2 T
检验的基本思想：公式中A为实际观察值，T为理论值，它是根据检验假设来确定的，假设各样本率或比所属总体的率或比相同(H0)。如果这一假设成立，则各样本率或比就应该比较接近，实际数和理论数就不会相差太大，计算的x2值就比较小；反之计算的x2值就大。因此， x2值反映了实际数与理论数吻合的程度，但是x2值的大小，除决定于A－T的差值外，还取决于格子数(严格说是自由度)的多少，因为各格的(A －T)2/T 都是正值，故格子数越多， x2 值也越大。只有排除了这种影响， x2值才能正确反映A 和 T 的吻合程度，所以在查 x2 值表时必须考虑自由度的大小。

式中a、b、c、d分别代表四个格子的实际数，现仍以例为例11.7 ,见表11-3-2 ，代入公式：
(18105- 190 2)2 315 5.4627 (18 190)(2 105)(18 2)(190 105)
2
计算结果与基本公式一致。
19:46
四格表校正公式

应用基本公式和四格表资料专用公式的条件是n≥40，且 T≥5。当n≥40，但1≤T＜5时，应使用校正公式，否则会使卡方值偏大而造成结论错误。校正公式：
19:46
第11章
计数资料的统计推断
19:46
第11章计数资料的统计推断
学习目标 1．掌握率的抽样误差、率的标准误的概念，计数资料的U检验的方法及应用条件 2．熟悉率的标准误的计算和用途 3．了解率的u检验的方法和应用条件
19:46
主要内容
一、率（或构成比）的抽样误差和标准误二、总体率（或构成比）的估计:点估计、区间估计三、总体率（或构成比）的假设检验 1. 率（或构成比）的检验 2. x2检验四、假设检验的注意事项
建立假设：H0： π1 =π2 H1： π1 ≠π2 α=0.05 计算各格子理论数(见表中)：计算x2值：本例有两个格子的理论数小于5，且n＞40，故应用校正公式：

2
( 2 9 26 5 42/2)2 42 2814 7 35
3.62
确定P值： υ=(2-1)(2-1)=1 , x20.05,1= 3.84 3.62 ＜3.84, 故P＞0.05 差异无显著性
H1：π ≠π0
1.79

0.1333 0.0872 0.0872 (1 0.0872 ) / 120
确定P值：本例 1.79<1.96 , 故P>0.05 , 差异无显著性。判断结果：按α=0.05 水准，拒绝H0，接受H1，可以认为某县该病的发病率与全国该病的发病率没有差别。
19:46
两个样本率的比较

计算公式如下：
u
PC
p1 p2 S P1 P2
X1 X 2 n1 n2

p1 p2
pc (1 pc )(1 / n1 1 / n2 )
S P1 P2
式中P1 、P2为样本率，SP 1-P 2 为两样本率之差的标准误，PC为合并样本率，n1和n2 分别为两样本含量， X1和X2分别为两样本的某类发生数。
2 ( b c ) 2 bc
当b+C＜40时:

e商务文档

第11章计数资料的统计推断-已经更换模板(李嗣生)

相关文档推荐：

e商务文档

第11章 计数资料的统计推断-已经更换模板(李嗣生)

相关文档推荐：

第11章计数资料的统计推断-已经更换模板(李嗣生)