独立性检验26239
根据临界值表知P(K2≥2.706)≈0.10.………………………9分 因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出 生的时间有关系.……………………………………………12分
【阅卷人点拨】通过阅卷后分析,对解答本题的失分警示和解题启示总结如 下:(注:此处的①②见规范解答过程).
在解答过程中,若①处和②处插入表格处表中数据
分类变量有关系”.
【典例训练】 1.(2012·武汉高二检测)在独立性检验中,若随机变量K2的观测值k≥6.635,则 () (A)X与Y有关系,犯错的概率不超过1% (B)X与Y有关系,犯错的概率超过1% (C)X与Y没有关系,犯错的概率不超过1% (D)X与Y没有关系,犯错的概率超过1%
2.(2012·厦门高二检测)在对人们休闲方式的一次调查中,共调查120人,其中 女性70人、男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要 的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要 的休闲方式是运动. (1)根据以上数据建立一个2×2的列联表; (2)休闲方式与性别是否有关?
而2.706<703.45209<630.84610,
7
因为P(K2>2.706)≈0.10,P(K2>3.841)≈0.05,
所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与
性别有关.
【思考】1.求k的值的关键是什么? 2.k的大小对“两个变量有关”有什么影响? 提示:1.求K2的观测值k的关键是要准确列出2×2列联表,即找准表达式中的 各个量的数值. 2.利用K2的观测值进行独立性检验可以精确地给出这种判断的可靠程度,而 且k的值越大,说明“X与Y有关系”成立的可能性越大.
2.独立性检验与反证法的异同点 独立性检验的思想来自于统计学的假设检验思想,它与反证法类似,假设检 验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定 结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合 逻辑的事件的发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件 的发生,即在结论不成立的假设下,推出利用结论成立的小概率事件的发生.
2.列联表中|ad-bc|的值与两个分类变量之间相关的强弱有什么关系? 提示:在列联表中,若两个分类变量没有关系,则|ad-bc| ≈0,所以|ad-bc|的值越小,两个分类变量之间的关系越弱;|ad-bc| 的值越大,两个分类变量之间的关系越强.
3.作散点图的主要目的是_______. 【解析】散点图可以形象地展示两个变量之间的关系,所以它的主要目的就 是直观了解两个变量之间的关系. 答案:直观了解两个变量之间的关系
系,那么这种判断出错的可能性为_______.
2.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据 如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生 产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、等高条 形图、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错 误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质 量有关?
独立性检验的综合应用 【技法点拨】
判断两个变量是否有关的三种方法
列联 表法
数形 结合 法
c 利用列联表,列出2×2列联表,从 c+d 和
a 的大小比较或 ad-bc 的大小进行判断. a +b
利用数形结合,画出等高条形图,从对应面积 的比例粗略估计.
K2观 测值法
利用K2的观测值公式求出K2的观测值k,借助 临界值表准确地判断“X与Y是否有关系”.
等高条形图的应用
【技法点拨】
1.判断两个分类变量是否有关系的两个常用方法
(1)利用数形结合思想,借助等高条形图来判断两个分类变量
是否相关是判断变量相关的常见方法.
(2)一般地,在等高条形图中, 与 相差越大,两个分
类变量有关系的可能性就越大.
a
c
ab cd
2.利用等高条形图判断两个分类变量是否相关的步骤
990 510 1 500
相差较大,可在某种程度上认为“质量监督员甲是否在现场与
产品质量有关系”.
(2)画等高条形图. 如图可知,在某种程度上认为“质量监督员甲是否在生产现场与产品质量有 关系”.
(3)由2×2列联表中数据,计算得到K2的观测值为
k 1 500 (98217 493因此8),2 在1犯3.错09误7 的 10.828, 概率不超99过00.501001的1前4提75下 2,5认为质量监督员甲在不在生产现
4.若由一个2×2列联表中的数据计算得K2的观测值k=4.013,则认为“两个变 量有关系”犯错误的概率不超过_______. 【解析】∵P(K2≥3.841)≈0.05, ∴认为“两个变量有关系”犯错误的概率不超过0.05. 答案:0.05
1.对于“分类变量”的理解 (1)这里的“变量”和“值”都应作为“广义”的变量和值进行理解.例如,对 于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的 “值”指的是“男”和“女”.因此,这里所说的“变量”和“值”不一定取 的是具体的数值.
【解析】1.根据独立性检验的思想,假设没关系正确的可能性为5%,所 以,判断有关系错误的可能性也为5%. 答案:5%
2.(1)2×2列联表如下:
合格品数 次品数 总计
甲在生产现场
982
8
甲不在生产现场 493
17
由列联表可得|总ad计-bc|=|982×171-44973×58|=12 72550.
2.作列联表如下:
考前心情紧张 考前心情不紧张
总计
性格内向 332 94 426
性格外向 213 381 594
总计 545 475 1 020
相应的等高条形图如图所示,
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图 中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中 性格内向占的比例高,可以认为考前紧张与性格类型有关.
1.2 独立性检验的基本思想及其初步应用
1.掌握2×2列联表的独立性检验,能利用给出的数据列出列联表并会求K2的 观测值. 2.了解独立性检验的基本思想和方法.
1.本节课的重点是理解独立性检验的基本思想及实施步骤. 2.本节课的难点是了解随机变量K2的含义和根据K2的值得出结论的意义.
1.分类变量 变量的不同“值”表示个体所属的_____不,同像类这别样的变量
【典例训练】 1.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体 数据如下表:
专业 性别
男
女
非统计专业 13 7
统计专业 10 20
为了判断主修统计专业是否与性别有关系,根据表中的数据,
得到 k 50(13 20 10 7)2 4.844 因为P(k≥3.8412)3=0.2075, 2所0以 3判0定主修统计专业与性别有关
【典例训练】 1.从发生交通事故的司机中抽取2 000名司机作随机样本,根据他们血液中是 否含有酒精以及他们是否对事故负有责任将数据整理如下:
有酒精 无酒精
总计
有责任 650 700
1 350
无责任 150 500 650
总计 800 1 200 2 000
相应的等高条形图如图所示.试结合等高条形图分析血液中含有酒精与对事故 负有责任是否有关系.
失 ① 填写错误,会直接导致合计出错,也会直接导致k值
分
求错,这种情况最多给3分.
警
在解答中,若③处公式记混,会导致k值出错,使得
示 ② 独立性检验出错,这种情况,只能给第(1)问的分数
6分
解 (1)错误填写2×2列联表,导致出错; 题
(2)记准K2的计算公式,不至于因错记公式而出错; 启
示 (3)正确回答独立性检验的结论.
【归纳】等高条形图的作法及作用小结. 提示:1.首先作2×2列联表,注意对涉及的变量分清类别;其次要注意计算的准 确性;第三画等高条形图,注意各变量的顺序与所画位置. 2.通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地 给出所得结论的可靠程度.
独立性检验 【技法点拨】
解决一般的独立性检验问题的步骤
3.判断两个分类变量是否有关系的两种方法比较 判断两个分类变量是否有关系的两种方法是:等高条形图和独立性检验. (1)通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判 断无法精确地给出所得结论的可靠程度. (2)利用独立性检验来判断两个分类变量是否有关系,能够精确地给出这种判 断的可靠程度,也常与图形分析法结合.
3.独立性检验
(1)定义:利用随机变量K2来判断“两个分类变量有关系”的
方法称为两个分类变量的独立性检验.
(2)公式:K2=
.其中n=_____.
______n(_ad__bc_)2
a+b+c+d
(a b)(c d)(a c)(b d)
1.在独立性检验中,计算得k=29.78,在判断变量相关时,P(K2≥6.635)≈0.01的 含义是什么? 提示:P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为 两个变量相关.
【规范训练】(12分)(2012·大庆高二检测)调查在2~3级风时
的海上航行中男女乘客的晕船情况,共调查了71人,其中女性
(1)将下面的2×2列联表补充完整;
出 生 时
性别 间 男婴 女婴 总计
晚上
白天
总计
(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?
P(K2≥k) k
0.15 2.072
K2
n(ad bc)2
(a b)(c d)(a c)(b d)
0.10 0.05 2.706 3.841