当前位置:
文档之家› 高考必备——独立性检验-独立性检验
高考必备——独立性检验-独立性检验
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.82
P( K 2 k0 )
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
例 1:研究吸烟与患肺癌的关系. 1.确定研究对象:吸烟与患肺癌的关系. 2.采集数据——列联表: 不患肺癌 不吸烟 吸烟 总计 7775 2099 9874 患肺癌 42 49 91 总计 7817 2148 9965
不吸烟不患肺癌 吸烟不患肺癌 a c .即“ ” ab cd 不吸烟总数 吸烟总数
得 ad bc 0 ,所以 | ad bc | 越小,说明吸烟与患肺癌关系越弱,反之越强. (2)构造随机变量 K 2
n(ad bc) 2 (其中 n a b c d ) (a b)(c d )(a c)(b d )
2 2
0.15 2.072
0.10 2.706
0.05 3.841
0.025 5.024
0.010 6.635
0.005 7.879
0.001 10.828
,其中 n=a+b+c+d)
5.某校在规划课程设置方案的调研中, 随机抽取 160 名理科学生, 想调查男生、 女生对 “坐标系与参数方程” 与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等 式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多 25 人,根据调研情况制成如下图所示的列联表: 选择坐标系与参数方程 男生 女生 合计 160 60 选择不等式选讲 合计
高考必备——独立性检验
1.随机变量: K 2
n(ad bc) 2 , P( K 2 6.635 ) 0.010(小概率事件) (a b)(c d )(a c)(b d )
2.独立性检验:运用统计分析的方法确定分类变量的关系. (1)要判断“两个分类变量有关系” ; (2)假设结论不成立,即“ H 0 :两个分类变量没有关系” ; (3)确定一个判断规则的临界值 k0 :当 K 2 k0 时,认为“两个分类变量有关系” ,否则认为“两个分类 变量没有关系” ; ( k0 是根据允许误判概率的上限来确定的) (4)按照上述规则,误判概率为 P( K 2 k0 ) .
2
(3)科学研究表明: P( K 2 6.635 ) 0.010. 即“当 K 6.635时,事件发生的概率为 0.010(小概率 事件——几乎不可能发生) ” (4)根据所采集的数据算得:在 H 0 成立的情况下, K 56.632,远远大于 6.635,所以我们断定 H 0 不
2
2
女 20 30 50
合计 60 50 110
40 20 60 算得,
a+b
n ad-bc 2 c+d a+c
2
b+d
χ2=
110
40×30-20×20 60×50×60×50
≈7.8. 0.050 3.841 0.010 6.635 0.001 10.828
P(χ2≥x0) x0源自参照附表,得到如下说法,其中正确的是________. ①再犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” ; ②再犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” ; ③有 99%以上的把握认为“爱好该项运动与性别有关” ;
(Ⅰ)完成列联表,并判断在犯错误的概率不超过 0.025 的前提下,能否认为选题与性 别有关. (Ⅱ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中 共抽取 8 人进行问卷.若从这 8 人中任选 3 人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数 的差为 ,求 的分布列及数学期望 E . 附: K 2
④有 99%以上的把握认为“爱好该项运动与性别无关” . 4.近年来我国电子商务行业迎来发展的新机遇.2016 年双 11 期间,某购物平台的销售业绩高达 918 亿人民 币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出 200 次成功 交易,并对其评价进行统计,对商品的好评率为 0.6,对服务的好评率为 0.75,其中对商品和服务都作出 好评的交易为 80 次. (1)能否在犯错误的概率不超过 0.001 的前提下,认为商品好评与服务好评有关? (2) 若将频率视作概率, 某人在该购物平台上进行 5 次购物中, 设对商品和服务全好评次数为随机变量 X: ①求对商品和服务全为好评的次数 X 的分布列(概率用组合数算式表示) ; ②求 X 的数学期望和方程. P(K ≥k) k (K =
D.a=30,c=30
2.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,下列说法中正确的是________. ①100 个吸烟者中至少有 99 人患有肺癌; ②1 个人吸烟,那么这个人有 99%的概率患有肺癌; ③在 100 个吸烟者中一定有患肺癌的人; ④在 100 个吸烟者中可能一个患肺癌的人也没有. 3.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 爱好 不爱好 合计 由χ =
成立,即“吸烟与患肺癌有关系”.误判概率不超过 P( K 2 6.635 ) 0.010.
【巩固训练】 1.假设有两个分类变量 X 和 Y 的 2×2 列联表: Y X x1 x2 总计 a c 60 10 30 40 ) a+10 c+30 100 y1 y2 总计
对同一样本,以下数据能说明 X 与 Y 有关系的可能性最大的一组为( A.a=45,c=15 B.a=40,c=20 C.a=35,c=25
(1)由列联表可直观的了解:吸烟群体和不吸烟群体患肺癌的可能性存在差异.. 3.独立性检验: (类似于反证法) (1)假设 H 0 :吸烟与患肺癌没有关系. 把表中数据用字母代替,得 不患肺癌 不吸烟 吸烟 患肺癌 总计
a c
b
d
ab
cd
总计
ac
bd
abcd
若“吸烟与患肺癌没有关系” ,则