当前位置:文档之家› 8.4 列联表独立性分析案例(2)

8.4 列联表独立性分析案例(2)

8.4 列联表独立性分析案例(2)
一、教学目标
(一)知识目标
通过对典型案例(如“新药的副作用 ”“秃顶与患心脏病是否有关系”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。

(二)能力目标
让学生经历数据处理的过程,提高探索解决问题的能力。

(三)情感目标
通过独立性检验的基本思想的学习,让学生有真正对统计思维和确定思维差异的理解,体会到统计在现实生活的广泛应用。

二、教学重点
理解独立性检验的实施步骤
三、教学难点
理解独立性检验的实施步骤
四、教学过程
(一)引入课题
1.复习 A :独立性检验 B : ()
()()()()
2
2
n ad bc k a b c d a c b d -=
++++
2.独立性检验的思想(类似反证法)
(二)案例讲解
了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50位患者服用安慰剂,得到下列实验数据:
请问服用新药是否可产生副作用?
分析:
假定服用新药与产生副作用没有关联.那么,首先要给“没有关联”下一个“能够操作”的定义。

根据直观的经验,在服用新药与产生副作用的情形下,这个定义可以是这样的:如果服用新药与产生副作用没有关联,就意味着,无论服用新药与否,产生副作用的概率都是一样的。

就此例题而言:
.19.0100
19)(==
全体实验者产生副作用
P ,
3.050
15)(==
服用新药产生副作用
P 二者相差较大。

由此可以推断,开始的假设是不成立的。

也就是说,服用新药与产生副作用是有关联的。

由统计的常识知道,要求等号成立是非常苛刻的条件,实际上一般也是办不到的,我们所能追求的是在概率意义下的可靠性。

对于上面的独立性问题,我们应当寻找一个适当的统计量,用它的大小来说明独立性是否成立。

在统计中,我们引入下面的量
在前面的例
子中
a =15,
b =35,
c =4,
d =46。

注意到独立性要求:
P (全体生实验者产生副作用)=P (服用新药产生副作用) 即
b a a n
c a +=
+
这等价于 n
a n
c a n
b
a =
+⋅
+
因此,可以用n
c
a n
b a n
a +⋅
+-
的大小来衡量独立性的好坏。

问题: (1)用
n
c
a n
b a n
a +⋅+-

n
d
b n b a n
b +⋅+-

n
c a n
d c n
c +⋅
+-

n
d b n
d c n
d +⋅
+-
是不是更好些?
(2)用n
c a n b a n
c
a n
b a n a
+⋅++⋅+-
|
|
比用n
c a n b a n a +⋅
+-合理,你认为有道理吗? (3)为了得到统计量的近似的分布,统计学家最终选用了:
Q
2
=⎪⎪
⎪⎪⎭
⎫ ⎝⎛+⋅++⋅+-++⋅++⋅+-++⋅++⋅+-++⋅++⋅+-n d b n d c n d b n d c n d n d c n c a n d c n c a n c n d b n b a n d b n b a n b n c a n b a n c a n b a n a n 2222)()()()(
用它的大小来衡量独立性的大小,你能把它化简得到下式吗?
,)
)()()(()
(2
2
d b c a d c b a bc ad n Q
++++-=
c +
从上面的表达式可以直观地看出:2
Q 的值越小,
事件A 与B 之间的独立性将会越大(当2
Q 的值为0时,
事件A 与B 完全独立)。

通过有关统计量分布的计算可知:当84.32>Q 时,事件A 与B 在概率为95%的意义下是相关的;当63.62>Q 时,事件A 与B 在概率为99%的意义下是相关的。

我们来算一算本题中2Q 的值:
,63.686.781
195050)
4354615(1002
2
>=⨯⨯⨯⨯-⨯⨯=Q
于是得出结论:在概率为99%的意义下,服用新药与产生副作用是相关联的。

从数据可以进一步看出,服用新药更容易产生副作用。

上述过程在统计推断叫做独立性检验,它的基本思想是:
如何选用一个标准,用它来衡量事件之间的独立性是否成立。

在独立性检验中,我们要特别关注方法的直观及合理性。

至于最后选取的量及其大小的界定,我们可以只告诉学生结果,使其能够操作,这样并不会影响学生对问题实质的理解。

(三)巩固练习
在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。

利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
分析:根据题目所给数据得到如下列联表:
根据列表中的数据,得到: 2
2
1437(214597175451)
16.373 6.6353891048665772
K
⨯⨯-⨯=
≈>⨯⨯⨯
因为2( 6.635)0.01P K ≥≈
所以有99%的把握认为“秃顶与患心脏病有关”。

所推断结论对住院的病人群体有效。

(四)课堂小结 利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
独立性检验的基本思想类似于数学上的反证法,要确认“两个分类变量有关系”这一结
论成立的可信度,首先假设两个分类变量没有关系,再求随机变量K 2
的观测值k ,,k 值应该很小,如果很大,则在一定程度上说明假设不可信。

由实际计算出的k >6.635,说明假设不合理的程度为99℅,即“两个分类变量有关系”这一结论成立可信度约为99℅.
五、布置作业
课本P87习题10
补充题:
1.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动,男性中有21人主要的休闲方式是看电视,另外33人的主要休闲方式是运动,试判断性别与休闲是否有关系。

2.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示:
试按照原试验目的做统计分析推断。

相关主题