统计学 《独立性检验》
未感冒 使用血清 未使用血清 合 计 感冒 合 计
258 216 474
242 284 526
500 500 1000
数据处理
为研究不同的给药方式( 例2 为研究不同的给药方式(口服与注 和给药的效果(有效与无效) 射)和给药的效果(有效与无效)是否有 进行了相应的抽样调查, 关,进行了相应的抽样调查,调查结果如 下表,根据所选择的193个病人的数据, 个病人的数据, 下表,根据所选择的 个病人的数据 能否作出药的效果与给药方式有关的结论。 能否作出药的效果与给药方式有关的结论。
有 效 口 服 注 射 合 计 无 效 合 计
58 64 122
40 31 71
98 95 193
数据处理
小 结
1.独立性检验的基本思想类似于反证法.即 1.独立性检验的基本思想类似于反证法. 检验要判断的是: 检验要判断的是:样本数据是否提供了不 利于断言的证据; 利于断言的证据; 2.掌握独立性检验的基本方法; 2.掌握独立性检验的基本方法; 3.独立性检验得出的是结论成立的把握程 3.独立性检验得出的是结论成立的把握程 度,是纯统计上的关系,里面不存在因果关 是纯统计上的关系, 系.
成立的条件下,患病且吸烟的人数为 在H0成立的条件下 患病且吸烟的人数为
a + b a + c (a + b)(a + c) n × P ( AB ) ≈ n ⋅ ⋅ = n n n
行总和 表总和 列总和
独立性检验定义: 独立性检验定义:
用 χ 统计量研究上述这类问
2
题的方法称为独立性检验
独立性检验的基本方法 一般地,对于两个研究对象Ⅰ 一般地,对于两个研究对象Ⅰ 和Ⅱ, Ⅰ有两类取值,既类A和 有两类取值,既类A 也有类1和类2两类, 类B, Ⅱ也有类1和类2两类,由 下表: 下表: Ⅱ 类1 类2
独立性检验
(了解即可) ♣ χ 2检验的自由度 = (行数 − 1) × (列数 − 1)
为什么2×2列联表只有一个自由度?
患 病 吸 烟 不吸烟 合 计 未患病 合 计 220 295 515
58
457
对于丢失的四个数据,需要知道几个就可补 齐这张表?
例1 在500人身上试验某种血清预防感冒 500人身上试验某种血清预防感冒 的作用, 的作用,把他们一年中的感冒记录与另外 500名未用血清的人的感冒记录作比较 500名未用血清的人的感冒记录作比较, 名未用血清的人的感冒记录作比较, 结果如表所示, 结果如表所示,问:该种血清能否起到预 防感冒的作用? 防感冒的作用?
根据这些数据能否断定:患呼吸道疾病与吸烟有关? 根据这些数据能否断定:患呼吸道疾病与吸烟有关?
独立性检验
♣ 有无关系?——直观判断 有无关系?
患 病 吸 烟 不吸烟 合 计 37 21 58 患 病 吸 烟 不吸烟 16.82% 7.12% 未患病 183 274 457 未患病 83.18% 92.88% 合 计 220 295 515 合 计(n) 100%(220) 100%(295)
沙洲中学数学组
1 .1
独立性检验
某医疗机构为了了解呼吸道疾病与吸烟是否有 进行了一次抽样调查,共调查了515个成年人 个成年人, 关,进行了一次抽样调查,共调查了515个成年人, 其中吸烟者220人 不吸烟者295人 调查结果是: 其中吸烟者220人,不吸烟者295人,调查结果是: 吸烟的220人中有 人患呼吸道疾病 人中有37人患呼吸道疾病( 吸烟的220人中有37人患呼吸道疾病(以下简称患 ),183人未患呼吸道疾病 以下简称未患病); 人未患呼吸道疾病( 病),183人未患呼吸道疾病(以下简称未患病); 不吸烟的295人中有 人患病 274人未患病 人中有21人患病, 人未患病。 不吸烟的295人中有21人患病,274人未患病。
结论:吸烟者与不吸烟者患病的可能性存在差异 结论:
独立性检验
吸 烟 不吸烟 患 病 a c 未患病 b d 合 计 a+b c+d
合 计
a+c
b+d
n(=a + b + c + d) =
事件A——某人吸烟 某人吸烟 事件 事件 A ——某人不吸烟 某人不吸烟 事件B——某人患病 事件 某人患病 事件 B ——某人未患病 某人未患病 a+b a+c P ( A) ≈ P( B) ≈ n n 假设 H 0 :患病与吸烟没有关系 P ( AB) = P ( A) ⋅ P ( B )
推断Ⅰ与Ⅱ有关系, 推断Ⅰ 有关系 按如下步骤: 按如下步骤 ⑴提出假设 H0: Ⅰ与Ⅱ没有关系 ⑵根据2×2列联表 根据 × 列联表 χ 2的值 与公式计算
合计
a b a+b 类 ⑶查对临界值,作出 查对临界值 作出 Ⅰ A 判断. 判断 c d c+d 类 B 合计 a+c b+d a+b+c+d