当前位置:文档之家› 独立性检验原理

独立性检验原理

1.2 独立检验的基本思想及其 初步应用
第一课时
学习目标
• 1.了解分类变量的定义 • 2.会画2x2列联表和等高条形图 • 3.了解独立性检验原理,会用独立 性检验原理来判断两个变量之间是 否有关系。
自学指导1 • 阅读课本第91页至--92图3-8的 内容,注意下列问题 • 1.列联表的画法 • 2.等高条形图的画法
独立性检验的原理:
首先,假设结论不成立,即 H :两个分类变量没有关系
(在这种假设下k应该很小)
其次,由观测数据计算K 的观测值k,
(如果k很大,则在一定可信程度上说明H 不 成立,即两个分类变量之间有关系)
2
最后,根据k的值判断假设是否成立
临界值表:
P(K 2 k0 ) 0.50
0.40 0.70 8 0.25 1.32 3 0.15 2.07 2 0.10 2.70 6 0.05 3.84 1 0.02 5 5.02 4 0.01 0 6.63 5 0.005 7.879 0.001 10.82 8
系,是指有对
2. 在某医院,因为患心脏病而住院的665名男性 病人中,有214人秃顶;而另外772名不是因为 患心脏病而住院的男性病人中有175人秃顶。分 别利用图形和独立性检验方法判断秃顶与患心 脏病是否有关系?
解:根据题目所给数据得到如下列联表1-13:
k0
0.44 5
临界值
P( K 2 k ) 0.50
0.40
0.5
0.15
0.10
0.05 0.025 0.010 0.005 0.001
k
0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(1)如果k2>10.828,就有99.9%的把握认为“X与Y有关系” (2)如果k2>7.879,就有99.5%的把握认为“X与Y有关系” (3)如果k2>6.635,就有99%的把握认为“X与Y有关系”; (4)如果k2>5.024,就有97.5%的把握认为“X与Y有关系” (5)如果k2>3.841,就有95%的把握认为“X与Y有关系”; (6)如果k2>2.706,就有90%的把握认为“X与Y有关系”; (7)如果k2≤2.706,就认为没有充分的证据显示 “X与Y有关系”.
时间3分钟,同桌之间可以相互讨论
自学检测1
1.画等高条形图的目的是________ a 2.观察等高条形图,如果 发现 和 ab c 差距很大,就说两个分 类变量 cd 之间 _________
自学指导2
• 阅读课本第93页---第95页的内容,注意下 列问题: • 1.记忆随机变量K2的计算公式。 • 2. 注意K2的大小对相关关系强弱的影响。 • 3. 独立性检验的原理是什么? • 4.用自己的话总结用独立性检验原理判断相 关关系的具体过程。 时间6分钟,同桌之间可以相互商量
秃顶 不秃顶 总计
患心脏病 不患心脏 病 214 175 451 597 665 772 总计
389 1048 1437
假设秃顶和患心脏病之间没有关系 根据联表1-13中的数据,得到
1437 (214 597 175 451 ) k 16.373 10.828 3891048 665 772 所以有99.9%的把握认为“秃顶与患心脏病有
自学检测2
1.在吸烟与患肺病这两个分类变量的计算中,下列说法正
确的是(
c

A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与患 肺病有关系,那么在100个吸烟的人中必有99个患肺病 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关 系时,我们说某人吸烟,那么他有99%的可能患肺病 C、从独立性检验可知有99%的把握认为吸烟与患肺病有关
解:在假设“吃零食与是否患胃病之间没有 关系”的前提下K2应该很小,并且
P( K 3.841) 0.05,
2
而我们所得到的K2 的观测值k≈4.513超过 3.841,这就意味着“吃零食与是否患胃病 之间的关系”这一结论错误的可能性约为 0.05(或小于 0.05 ) ,即有95%(或大于 95%)的把握认为“吃零食与是否患胃病 之间有关系”。
或者:k>10.828,表示在犯错的概率不 超过0.001的前提下,X和Y有关系。
用独立性检验思想的步骤
• • • • 1.列2x2列联表 2. 假设两个分类变量之间没有关系 3.根据K2的计算公式计算K2 4.如果K2 ≥k0(临界值),下结论:“在推 断错误的概率不超过P的前提下,可以判断 ‘两个变量有关系’”,或者说“我们有 (1-P)x100%的把握认为‘两个变量有关 系’。 如果K2≤2.072,就说“没有足够的证据证 明两个变量有关系”。
2
2
例2 为考察高中生的吃零食与是否患胃病之间的 关系,在某城市的某校高中生中随机抽取300名学 生,得到如下联表:
患胃病 不患胃病 总计
吃零食 不吃零食 总计
37 35 72
85 143 228
122 178 300
由表中数据计算K2的观测值k≈4.513。在 多大程度上可以认为高中生的性别与是否喜 欢数学课程之间有关系?为什么?
相关主题