当前位置:文档之家› 独立性检验的思想方法

独立性检验的思想方法

独立性检验的思想方法
独立性检验实际上是检验两个分类变量是否相关,相关的程度有多大.在进行独位性检验时,应注意给定的可靠性的要求,不同的可靠性要求可能会导致得出完全不同的结论.在断言正确时很少发生的结果若发生了,就是断言不正确的证据.一般地,对分类变量的相关
关系的判断方法有:2×2列联表、二维条形图、三维柱形图和利用随机变量K 2来确定,与表
格相比,三维柱形图和二维条形图能够更直观地反映出相关数据的总体状况.并能从中清晰地看出各个频数的相对大小关系.三维柱形图和二维条形图因为所表示的关系只是一种粗略的估计,不能够精确地反应有关的两个分类变量的可信程度,因而不常用,并且在实际问题
的解决中也较为烦琐,故在判断两个分类变量的关系的可靠性时,一般利用随机变量K 2来
确定的.下面举例说明.
一.二维条形图
在二维条形图中,可以估计满足条件X=x 1的个体中具有Y= y 1的个体所占的比例b a a +,也可以估计满足条件X=x 2的个体中具有Y= y 2的个体所占的比例d c c +,两个比例的值相差越大,H 1成立的可能性就越大.
例 1.有甲、乙两个班级进行一门课程的考试,按照学生的考试成绩优秀和不优秀统计人数后,得到下面的列联表:
请画出列联表的二维条形图,并通过图形判断成绩与班级是否有关,利用列联表的独立性假设检验估计判断成绩是否优秀与所在班级是否有关.
分析:本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或三维柱形图,并进行分析,最后利用独立性检验作出判断.
解:根据列联表的数据,作出二维条形图,如图.
从条形图中可以看出,甲班学生中优秀的人数的比例数为
4510,乙班学生中优秀的人数的比例为45
7,二者差别不是很大,因此我们认为成绩是否优秀与所在的班级没有关系,用独立性假设检验来判断,由题意知a =10,b=35,c=7,d=38,a+b=45,c+d=45,a+c=17,b+d=73,n=90.
代入公式
))()()(()(2
2
d c c a d b b a bc ad n K ++++-=
.
65.073174545)3573810(902
≈⨯⨯⨯⨯-⨯⨯=k
由于0.65<2.706,所以我们没有充足的理由认为成绩优秀与班级有关系.
点拨:在列联表中注意事件的对应关系及有关值的确定,避免混乱.利用图形来判断两个变量之间是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以作两个分类变量关系的粗略的估计,可以结合所求的数值来进行比较.
练习:
1.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关,你所得到的结论在什么范围内有效?
解:根据题目所给的数据作出如下的列联表:
图形法:根据列联表作出相应的二维条形图,如图
从二维条形图来看,在男人中患色盲的比例为480
38,在女人中患色盲的比例为5206.又48038>5206,其差值为|48038-520
6|≈0.068,差值较大,因而我们可认为性别与患色盲是有关的.
根据列联表中所给的数据可以有a =38,b=442,c=6,d=514,a+b =480,c+d =520,a+c =44,b+d=956,n=1000,代入公式
,))()()(()(2
2
d c d b d a c a bc ad n K ++++-= 得14.27956
44520480)442651438(10002
≈⨯⨯⨯⨯-⨯⨯=k ,由于K ≈27.14 4>10.828, 所以我们有99.9%的把握认为性别与患色盲有关系.
二. 三维柱形图
在三维柱形图中,主对角线上两个柱形高度的乘积ad 与副对角线上的两个柱形高度的乘积bc 相差越大,H 1成立的可能性就越大,
例2.为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:
试用三维柱形图分析服用药和患病之间是否有关系.
分析:若要推断的论述为H0:X与Y有关系,可以用三维柱形图来粗略地判断两个分类变量X与Y是否有关系.
解:根据列联表所给的数据作出三维柱形图如图,
主对角线上两个柱形的高度a与d的乘积ad=10×30=300,与副对角线上两个柱形高度的乘积bc=20×45=900相差很大,因而服用药与未患病之间有关的程度很大.点拨:在三维柱形图中,应对主对角线上两个柱形的高度的乘积ad与副对角线上两个柱形高度的乘积bc作比较,两个乘积相差越大,H0成立的可能性就越大.练习:
2.研究人员选取170名青年大学生的样本,对他们进行一项心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定回答的有22名,否定回答的有38名;男生110名在相同的题目上作肯定回答的有22名,否定回答的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.
解:根据题目所给数据建立如下列联表:
性别与态度的关系列联表
相应的三维柱形图如图,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.
根据列联表中的数据得到
.024.5622.5126
4460110)88223822(1702
>≈⨯⨯⨯⨯-⨯⨯=k 所以有97.5%的把握认为性别与态度有关.
三. 利用随机变量K 2来确定
解独立性检验问题的基本步骤是:①找出相关数据,作列联表;②求统计量K 2的观测
值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.
例 3.运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构通过考察160位专业运动员运动前是否做热身运动而得到的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?
解:由))()()(()(2
2
d b d c b a c a bc ad n K ++++-= .94.3896
646595)45762019(1602
≈⨯⨯⨯⨯-⨯⨯=k 因为38.974>10.828,所以有99.9%的把握认为运动员受伤与不做热身运动有关. 点拨:独立性检验是用来考查两个分类变量是否具有相关关系,并且能较精确地给出这
种判断的可靠程度的一种统计方法.利用这一方法,可以直接用K 2的观测值解决实际问题.这
里需特别说明的是:K 2与k 的关系并不是k=2K ,K 2
是一个随机变量,它在a,b,c,d 取不同的值时,K 2可能不同;而k 是K 2
的观测值,是取定一组数a 、b 、c 、d 后的一个确定的值.
练习:
3.某些行为在运动员的比赛之中往往被赋予很强的神秘色彩,如有一种说法认为,在进入某乒乓球场比赛时先迈入左脚的运动员就会赢得比赛的胜利.某记者为此追踪了某著名乒乓球运动员在该球场中的308场比赛.获得数据如下表:
据此资料,你能得出什么结论? 解:由))()()(()(2
2
d c d b b a c a bc ad n K ++++-= , 得.502.146
262103205)278419178(3082
≈⨯⨯⨯⨯-⨯⨯=k 因为1.502<2.706,所以我们认为先迈进哪只脚跟比赛的胜负是无关的.
在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能错误,这是数学中的统计思维与确定性思维差异的反映,但我们可以利用统计分析的结果去预测实际问题的结果.。

相关主题