计数资料的统计推断
21
四格表配对计数资料
甲乙两种培养基的生长情况
乙种 + 合计 + 1 (a) 1 3 (c) 14
甲种 7 (b) 7 (d) 14
合计 18 10 28
22
例:问两种培养基的效果是否不同
第一步:建立假设 H0 : B=C=b+c/2 H1 : B‡C 第二步:确定显著性水平 α=0.05 第三步:计算统计量: b+c>40时,基本公式
样本所代表的总体间是否存在着差别做出判断。 样本所代表的总体间是否存在着差别做出判断。
2
主要内容
一、率(或构成比)的抽样误差和标准误 二、总体率(或构成比)的估计:点估计、区间
估计
三、总体率(或构成比)的假设检验
1.率(或构成比)的 µ 检验 2. x2检验
四、假设检验的注意事项
一、率(或构成比)的抽样误差和标准误
11
(1)四格表资料的x2检验
什么是四格表资料?凡是两个率或构成比资料都 可以看做四格表资料。举例。
组别 实验组 对照组 合计 发病人数 14 30 44 未 发 病人数 86 90 176 观察例数 100 120 220 发病率(%) 14 25 20
14 30
86 90
四格表的一般形式
组 别 1 2 合计 阳 性 a c a+c 阴 性 b d b+d 合计 a+b c+d a+b+c+d
只能说明不全相同, 只能说明不全相同,但不能确定 哪两个不同。需要进一步证明时, 哪两个不同。需要进一步证明时, 用行x列表的 分割法。 列表的x 用行 列表的 2分割法。
30
注意事项
1 假设检验时可能犯两类错误 2.选择检验方法要注意符合其应用条件 选择检验方法要注意符合其应用条件 3.正确理解假设检验的结论 正确理解假设检验的结论 4.当差别无显著性时 有两种可能 当差别无显著性时,有两种可能 当差别无显著性时 5.统计学的显著性与否和日常生活中的 统计学的显著性与否和日常生活中的 显著性概念不同. 显著性概念不同 6.单侧检验与双侧检验 单侧检验与双侧检验
理论频数与自由度的计算:A是实际频数,T是根据假设检验 理论频数与自由度的计算: 是实际频数, 来确定的,当H0成立时,计算出的格子中的数。每个格子中 成立时,计算出的格子中的数。 来确定的, 的理论频数计算公式为:TRC=NRxNC/N, NR所在的行合计, , 所在的行合计, 的理论频数计算公式为: NC所在的列合计,代入公式中求x2值。 所在的列合计, (求上例的4个T值) 四格表资料的专用公式: 四格表资料的专用公式:
自由度一定时,P值越小, x2值越 大。 当P 值一定时,自由 度越大, x2 越大。 υ=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, υ=1, x2 =3.84 υ=2, x2 =5.99 当自由度取1时, u 2 = x2
9
x2检验的基本公式
(A −T) χ =∑ T
某医生想观察一种新药对流感的预防效果, 某医生想观察一种新药对流感的预防效果,进行了如下 的研究,问此药是否有效? 的研究,问此药是否有效?
组别 实验组 对照组 合计 发病人数 14 30 44 未 发 病人数 86 90 176 观察例数 100 120 220 发病率(%) 14 25 20
8
x2分布规律
2
2
A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察 到的例数。 ∑ :求和符号 自由度:υ=(R-1)x(C-1) R行数, C列数 注意:是格子数,而不是例数。
10
基本原理
(A −T) χ =∑ T
2 2
如果假设检验成立,A与T不应该相差太大。 理论上可以证明 ∑(A-T)2/T服从x2分布, 计算出x2值后,查表判断这么大的x2是否为 小概率事件,以判断建设检验是否成立。
均数的标准差和标准误(复习 。 均数的标准差和标准误 复习)。 复习
抽样误差产生的原因、概念 标准误的计算公式 与样本量的关系:成反比。
σp = π (1 − π )
n
Sp =
p(1 − p) n
例题:某市为了解已婚育龄妇女子宫颈癌的患病 情况,进行了抽样调查,随机抽取2000人,患者 80例。试求此患病率的标准误。
χ
专用公式:
2
=
∑
2
(A − T ) T
2
χ
=
(b
− c) b + c
2
b+c≤40时,校正公式:
χ
或
2
=
∑
=
( A − T − 0 .5 ) 2 T
χ
2
(b
− c − 1) b + c
2
自由度:ν=(2-1) x (2-1)=1 第四步:确定P值 第五步:判断结果
24
行x列表配对计数资料
甲 法 正常 减弱 异常 合计 乙法 正常 60 0 8 68 减弱 3 42 9 54 异常 2 9 17 28 合 计 65 51 34 150
13
四格表资料的专用公式
( ad − bc ) n 2 χ = ( a + c )( a + b )( c + d )( b + d )
2
适用条件: 当不满足上述条件时用 校正公式。
n ad − bc − n 2 χ2 = ( a + c )( a + b )( c + d )( b + d )
28
配对计数资料的关联与差异问题
关联与差异是不同的问题,共有四种 组合: 1. 有关联无差异 2. 有关联有差异 3. 无关联无差异 4. 无关联有差异
29
四、注意事项
1、计量资料的注意事项同样 、 适用( 适用(见下张幻灯片) 2、公式的适用条件n 2、公式的适用条件n 、T 3、多组率经x2检验有显著性时, 、 检验有显著性时,
31
四格表的确切概率法
此方法是四格表的补充 当 n < 40 或 至少有一T < 1
Pi =
(a + b)!(c + d )!(a + c)!(b + d )!
a !b !c !d !n !
P=
å
Pi
32
第七 讲 计数资料的统计推断
统计推断
用样本信息推论总体特征的过程。 用样本信息推论总体特征的过程。 包括: 包括: 参数估计: 运用统计学原理, 参数估计 运用统计学原理,用从样本计算出来的统计指
标量,对总体统计指标量进行估计。 标量,对总体统计指标量进行估计。
假设检验:又称显著性检验, 假设检验:又称显著性检验,是指由样本间存在的差别对
2
该公式从基本公式推 导而来,结果相同。 计算较为简单。 适用条件: N>40且 T≥5
例题
上例:问此药是否有效。 上例:问此药是否有效。 第一步: 第一步:建立假设 H0 : π1=π2 =20% π H1 : π1 ‡ π2 第二步: 第二步:确定显著性水平 α=0.05 第三步:计算统计量: 值大于5, 第三步:计算统计量: n =200>40,每格的 值大于 , ,每格的T值大于 可选用公式??(计算过程) ??(计算过程 可选用公式??(计算过程) 第四步:确定P值 第四步:确定 值 第五步:判断结果 第五步:
配对计数资料的关联问题
第一步: 第一步:建立假设 H0 :两法结果独立 H1 :两法结果不独立 第二步: 第二步:确定显著性水平 α=0.05 第三步:计算统计量: 第三步:计算统计量:
p ij = p i p j p ij ¹ p i p j
完全类似于成组资料比较的公式
第四步:确定P值 第四步:确定 值 第五步: 第五步:判断结果
二、总体率(或构成比)的估计
点估计:将样本率直接作为总体率的估计值. 区间估计(对照总体均数的区间估计) 公式: P±Uα.SP 条件: nP>5, n(1-P)>5 例题: 意义:
三、总体率(或构成比)的假设检验 总体率(或构成比) 假设检验
当两个样本率不同时,有两种可能: 1. P1 , P2所代表的总体率相同,由于抽样误 差的存在,造成的不同,这种差别在统计上叫 差别无统计学意义。 差别无统计学意义 2. P1 , P2所代表的总体率不同,即两个样本 来不同的总体,其差别有统计学意义 其差别有统计学意义。 其差别有统计学意义 现在就是要用统计学的方法进行判断到底 属于那种情况。
25
检验
第一步:建立假设 H0 : 两法分布相同 H1 :两法分布不相同 第二步:确定显著性水平 α=0.05 第三步:计算统计量: :
(ni - mi ) k- 1 T= å= 1 n + m - 2 A k i i i ii
k
26
2
检验
自由度:ν=k-1 第四步:确定P值 第五步:判断结果
27
1.总体率(或构成比)的 u检验
目的:比较一未知总体率与已知总体率是否相同 公式: p − π0
其中符号的含义
u =
适用条件: 已知π0 nP>5, n(1-P)>5
π 0 (1 − π 0 ) n
7
2. x2检验
是一种假设检验的方法,当样本量不大, 是一种假设检验的方法,当样本量不大, 或几个率进行比较时可用x 检验。 或几个率进行比较时可用 2检验。
19
配对计数资料的x2检验
什么是配对资料? 什么是配对资料?例
甲乙两种培养基的生长情况
乙种 + 合计 + 1 (a) 1 3 (c) 14