当前位置:文档之家› 高中数学 第一章 统计案例 1.2.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用学案 北师大版

高中数学 第一章 统计案例 1.2.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用学案 北师大版

2.2 独立性检验2.3 独立性检验的基本思想2.4 独立性检验的应用1.了解独立性检验的基本思想方法.(重点)2.了解独立性检验的初步应用.(难点)[基础·初探]教材整理1 独立性检验阅读教材P21~P24第1行部分,完成下列问题.设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1,有下面2×2列联表:BB1B2总计AA1a b a+bA2c d c+d总计a+c b+d n=a+b+c+d111取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目 新闻节目 总计 20至40岁 40 18 58 大于40岁 15 27 42 总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).【解析】 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.【答案】 是教材整理2 独立性检验的基本思想阅读教材P 24“练习”以下至P 25“练习”以上部分,完成下列问题. 在2×2列联表中,令χ2=n ad -bc2a +bc +da +cb +d,当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:(1)当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联.对分类变量X 与Y 的统计量χ2的值说法正确的是( ) A .χ2越大,“X 与Y 有关系”的把握性越小 B .χ2越小,“X 与Y 有关系”的把握性越小 C .χ2越接近于0,“X 与Y 无关系”的把握性越小D.χ2越大,“X与Y无关系”程度越大【解析】χ2越大,X与Y越不独立,所以关联越大;相反,χ2越小,关联越小.【答案】B[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:___________________________________________________解惑:___________________________________________________疑问2:___________________________________________________解惑:___________________________________________________疑问3:___________________________________________________解惑:___________________________________________________[小组合作型],2×2列联表在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa+b与cc+d判断二者是否有关系.【精彩点拨】对变量进行分类→求出分类变量的不同取值→作出2×2列联表→计算aa+b与cc+d的值,作出判断【自主解答】2×2列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得aa+b=4364≈0.671 875.cc+d=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa+b与cc+d⎝⎛⎭⎪⎫或ba+b与dc+d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.[再练一题]1.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.【解】作列联表如下:喜欢甜食情况性别喜欢甜食不喜欢甜食总计男 117 413 530 女 492 178 670 总计6095911 200,独立性检验在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.未感冒 感冒 总计 使用血清 258 242 500 未使用血清 216 284 500 总计4745261 000【精彩点拨】 独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.【自主解答】 假设感冒与是否使用该种血清没有关系.由列联表中的数据,求得χ2的值为χ2=1 000×258×284-242×2162474×526×500×500≈7.075.χ2=7.075≥6.635,查表得P (χ2≥6.635)=0.01,故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.1.熟练掌握χ2统计量的数值计算,根据计算得出χ2值,对比三个临界值2.706,3.841和6.635,作出统计推断.2.独立性检验的一般步骤: (1)根据样本数据列2×2列联表;(2)计算χ2=n ad -bc2a +bc +da +cb +d的值;(3)将χ2的值与临界值进行比较,若χ2大于临界值,则认为X 与Y 有关,否则没有充分的理由说明这个假设不成立.[再练一题]2.“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下: 【导学号:67720005】本地 外地 总计 去年 1 407 2 842 4 249 今年 1 331 2 065 3 396 总计2 7384 9077 645能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?【解】 按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系. 因为χ2=7 645× 1 407×2 065-2 842×1 33124 249×3 396×2 738×4 907≈30.35>6.635.所以在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系.[探究共研型],独立性检验的综合应用探究1 当χ2>3.841时,我们有多大的把握认为事件A 与B 有关?【提示】 由临界值表可知当χ2>3.841时,我们有95%的把握认为事件A 与B 有关. 探究2 在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.我们是否可以判定100个心脏病患者中一定有打鼾的人?【提示】 这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知100个心脏病患者中可能一个打鼾的人都没有.为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为45.是否有充足的证据说明,学生对创建工作的满意情况与性别有关?【精彩点拨】 解决本题首先根据对工作满意的概率,确定对工作满意的男女生人数,再画出2×2列联表,最后根据2×2列联表计算χ2,并进行判断.【自主解答】 由题意得2×2列联表如下:满意 不满意 总计 男生 50 5 55 女生 30 15 45 总计8020100χ2=100×50×15-30×5280×20×55×45≈9.091>6.635,所以我们有99%的把握认为学生对创建工作的满意情况与性别有关.1.独立性检验的基本思想是:要确认两个变量有关系这一结论成立的可信程度,首先假设结论“两个变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果用观测数据计算的统计量χ2很大,则在一定程度上说明假设不合理.由χ2与临界值的大小关系,作出判断.2.独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握说事件A 与B 有关,则推断结论为错误的可能性仅为5%(或1%).[再练一题]3.有两个变量x 与y ,其一组观测值如下2×2列联表所示:yxy 1 y 2x 1 a20-a x 215-a30+a其中a,15-a 均为大于5的整数,则a 取何值时,有95%的把握认为x 与y 之间有关系?【解】 由题意χ2=65[a 30+a -20-a 15-a ]220×45×15×50=6565a -300220×45×15×50=1313a -6025 400.∵有95%的把握认为x 与y 之间有关系, ∴χ2>3.841, ∴1313a -6025 400>3.841,a >7.7或a <1.5.又a >5,15-a >5,∴7.7<a <10. 又a ∈N , ∴a =8或a =9.[构建·体系]1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数与方差B.回归分析C.独立性检验D.概率【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.【答案】C2.(2016·长沙高二检测)为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算χ2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为( )AC.99% D.99.9%【解析】因为χ2>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.【答案】C3.在2×2列联表中,两个比值aa+b与________相差越大,两个分类变量有关系的可能性越大.【解析】根据2×2列联表可知,比值aa+b与cc+d相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.【答案】c c+d4.以下关于独立性检验的说法中,正确的是________.①独立性检验依据小概率原理;②独立性检验得到的结论一定正确;③样本不同,独立性检验的结论可能有差异;④独立性检验不是判断两分类变量是否相关的唯一方法.【解析】独立性检验得到的结论不一定正确,故②错,①③④正确.【答案】①③④5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品总计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.【解】将2×2列联表中的数据代入公式计算,得χ2=n ad-bc2a+b c+d a+c b+d=100×60×10-20×10270×30×80×20=10021≈4.762.因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.我还有这些不足:(1)___________________________________(2)___________________________________我的课下提升方案:(1)___________________________________(2)___________________________________学业分层测评(三) (建议用时:45分钟)[学业达标]一、选择题1.有两个分类变量X 与Y 的一组数据,由其列联表计算得χ2≈4.523,则认为“X 与Y 有关系”犯错误的概率为( )A .95%B .90%C .5%D .10%【解析】 χ2≈4.523>3.841.这表明认为“X 与Y 有关系”是错误的可能性约为0.05,即认为“X 与Y 有关系”犯错误的概率为5%.【答案】 C2.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女患色盲的频率分别为0.038,0.006B .男、女患色盲的概率分别为19240,3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关 【解析】 男人中患色盲的比例为38480,要比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈0.0676,差值较大. 【答案】 C3.为了探究中学生的学习成绩是否与学习时间长短有关,在调查的500名学习时间较长的中学生中有39名学习成绩比较好,500名学习时间较短的中学生中有6名学习成绩比较好,那么你认为中学生的学习成绩与学习时间长短有关的把握为( )A .0B .95%C.99% D.都不正确【解析】计算出χ2与两个临界值比较,χ2=1 000×39×494-6×461245×955×500×500≈25.340 3>6.635.所以有99%的把握说中学生的学习成绩与学习时间长短有关,故选C.【答案】C4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有________的把握认为糖尿病患者与遗传有关系.( )A.99.9% B.99.5%C.99% D.97.5%【解析】可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表:糖尿病发病糖尿病不发病总计阳性家族史1693109阴性家族史17240257总计33333366χ2=366×16×240-17×932109×257×33×333≈6.067>5.024.故我们有97.5%的把握认为糖尿病患者与遗传有关系.【答案】D5.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:y1y2总计x1a b a+b( ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =2,b =3,c =5,d =4【解析】 比较⎪⎪⎪⎪⎪⎪a a +b -c c +d . 选项A 中,⎪⎪⎪⎪⎪⎪59-35=245;选项B 中,⎪⎪⎪⎪⎪⎪58-46=124;选项C 中,⎪⎪⎪⎪⎪⎪25-49=245;选项D 中,⎪⎪⎪⎪⎪⎪25-59=745.故选D .【答案】 D 二、填空题6.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名):性别与喜欢文科还是理科列联表:【解析】 通过计算χ2=72×16×8-28×20236×36×44×28≈8.42>7.879.故我们有99.5%的把握认为中学生的性别和喜欢文科还是理科有关系. 【答案】 有7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 【导学号:67720006】专业性别非统计专业 统计专业男 13 10 女720χ2=50×13×20-10×7223×27×20×30≈4.844,因为χ2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.【解析】 ∵χ2>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.【答案】 5%8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若统计量χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②由独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③由独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.(填序号)【解析】统计量χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①错误;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.【答案】③三、解答题9.某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.(1)根据以上数据建立一个2×2列联表;(2)试问喜欢电脑游戏与认为作业多少是否有关系?【解】由题意列出2×2列联表:认为作业多认为作业不多总计喜欢玩电脑游戏10212不喜欢玩电脑游戏3710总计13922χ2=22×10×7-3×2212×10×13×9≈6.418,∵6.418>3.841,∴有95%的把握认为玩电脑游戏与认为作业多少有关系.10.在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机?【解】根据题意,列出2×2列联表如下:晕机不晕机总计男乘客243155女乘客 8 26 34 总计325789由公式可得χ2=89×24×26-31×8255×34×32×57≈3.689>2.706,故我们有90%的把握认为“在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机”.[能力提升]1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050 110由χ2=n ad -bc2a +bc +da +cb +d算得,χ2=110×40×30-20×20260×50×60×50≈7.8.附表:P (χ2≥k 0)0.050 0.010 0.001 k3.8416.63510.828A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 【解析】 根据独立性检验的思想方法,正确选项为C . 【答案】 C2.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大总计 男生 18 9 27 女生 8 15 23 总计262450若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过( ) A .0.01 B .0.025 C .0.10D .0.05【解析】 χ2=50×18×15-8×9226×24×27×23≈5.059>5.024,因为P (χ2>5.024)=0.025,所以这种推断犯错误的概率不超过0.025.【答案】 B3.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过________的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.超重 不超重 总计 偏高 4 1 5 不偏高 3 12 15 总计71320【解析】 根据公式χ2=n ad -bc2a +bc +da +cb +d得,χ2=20×4×12-1×325×15×7×13≈5.934,因为χ2>5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.【答案】 0.0254.(2016·沈阳二检)为了研究“教学方式”对教学质量的影响,某高中数学老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样).以下茎叶图为甲、乙两班(每班均为20人)学生的数学期末考试成绩.甲乙0 9 0 1 5 6 87 7 3 2 8 0 1 2 5 6 6 8 9 84 2 2 1 0 7 1 35 98 7 7 6 6 5 7 8 988775(1)现从甲班数学成绩不低于80分的同学中随机抽取两名同学,求成绩为87分的同学至少有一名被抽中的概率;(2)学校规定:成绩不低于75分的为优秀.请填写下面的2×2列联表,并判断有多大把握认为“成绩优秀与教学方式有关”.甲班 乙班 总计 优秀 不优秀 总计下面临界表仅供参考:P (χ2≥k ) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k2.0722.7063.8415.0246.6357.87910.828⎝⎛⎭⎪⎫参考公式:χ2=2a +bc +da +cb +d【解】 (1)记成绩为87分的同学为A ,B ,其他不低于80分的同学为C ,D ,E ,“从甲班数学成绩不低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共10个.“至少有一个87分的同学被抽到”所组成的基本事件有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共7个,所以P=710.(2)甲班乙班总计优秀61420不优秀14620总计202040χ2=40×220×20×20×20=6.4>5.024,因此,我们有97.5%的把握认为成绩优秀与教学方式有关.。

相关主题