数学选修2-3第三章-统计案例阶段测试3(含详细答案)阶段测试三(第三章统计案例)(时间:120分钟,满分:150分)一、选择题(每小题5分,共60分)1.下列关系中是相关关系的是()①路程与时间、速度的关系;②加速度与力的关系;③产品成本与产量的关系;④圆周长与面积的关系;⑤广告费支出与销售额的关系.A.①②④B.①③⑤C.③⑤D.③④⑤2.下列说法中表述恰当的个数为()①相关指数R2可以刻画回归模型的拟合效果,R2越接近于1,说明模型的拟合效果越好;②在线性回归模型中,R2表示解释变量对预报变量的贡献率,R2越接近于1,表示解释变量和预报变量的线性相关关系越强;③若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人为的错误或模型是否恰当.A.0 B.1C.2 D.33.(2016·重庆南开中学期末)巧克力很甜、很好吃,数学很妙、很有趣,某中学统计了部分同学“爱吃巧克力”与“数学成绩好”的关系,得到下表:经计算得k≈4.167,由此可以判断()参考数据:A.至少有99%的把握认为“数学成绩好”与“爱吃巧克力”有关B .至少有95%的把握认为“数学成绩好”与“爱吃巧克力”有关C .至少有99%的把握认为“数学成绩好”与“爱吃巧克力”无关D .至少有95%的把握认为“数学成绩好”与“爱吃巧克力”无关4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:经检验,这组样本数据具有线性相关关系,那么对于加工零件的个数x与加工时间y这两个变量,下列判断正确的是()A.成正相关,其回归直线经过点(30,75)B.成正相关,其回归直线经过点(30,76)C.成负相关,其回归直线经过点(30,76)D.成负相关,其回归直线经过点(30,75)5.下列关于等高条形图说法正确的是() A.等高条形图表示高度相对的条形图B.等高条形图表示的是分类变量的频数C.等高条形图表示的是分类变量的百分比D.等高条形图表示的是分类变量的实际高度6.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比例为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比例为60%7.(2016·大庆铁人中学期末)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:甲乙丙丁r 0.820.780.690.85m 115106124103则哪位同学的试验结果体现A,B两变量更强的线性相关性?()A.甲B.乙C.丙D.丁8.下列四个命题中①设有一个回归方程y=2-3x,变量x增加一个单位时,y平均增加3个单位;②命题p:“∃x0∈R,x20-x0-1>0”的否定綈p:“∀x∈R,x2-x-1≤0”;③设随机变量X服从正态分布N(0,1),若P(X>1)=p,则P(-1<X<0)=12-p;④在一个2×2列联表中,由计算得K2=6.679,则有99%的把握确认这两个变量间有关系.其中正确的命题的个数有()本题可以参考独立性检验临界值表:A.1个B.2个C.3个D.4个详解答案1.C①②④都是确定的函数关系.2.D3.B∵k=4.167∈(3.841,5.024),∴至少95%的把握认为“数学成绩好”与“爱吃巧克力”有关,故选B.4.B由收集的数据计算得x=30,y=76.又回归直线经过点(x,y),且正相关.5.C等高条形图表示的是两个分类变量的频率的比值,即分类变量的百分比.6.C从图中可以看出,女生喜欢理科的比例为20%,男生喜欢理科的比例为60%,这两个比例差值较大,说明性别与是否喜欢理科是有关系的.∴男生比女生喜欢理科的可能性大些.7.D因为相关系数|r|越大,残差平方和m越小,两变量的相关性越强,故选D.8.C①中,x与y负相关,x增加一个单位时,y平均减少3个单位,故①错,②正确.③中,由正态分布曲线关于x=0对称知,③正确.④中,K2=6.679>6.535,则有99%的把握确认这两个常量有关系.故②③④正确.9.(2016·大庆实验中学期末)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ), 算得K 2=110×(40×30-20×20)260×50×60×50≈7.8. 附表:参照附表,得到的正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别无关”10.下表是降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据,根据表中提供的数据,可求出y关于x的线性回归方程y^=0.7x+0.35,则表中m的值为()A.3B.3.15C.4D.4.511.已知x,y的取值如下表,从散点图可知y与x线性相关,且回归方程为y^=0.95x+a,预测当x=10时,y的估计值约为()A.12.1 B.12.2C.13.1 D.13.212.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”二、填空题(每小题5分,共20分)13.在研究身高和体重关系时,求得R2≈________时,可叙述为“身高解释了64%的体重变化”.14.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=a+bx i+e i(i=1,2,…,n).若e i恒为0,则R2为________.15.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y=-20x +a^.若在这些样本点中任取一点,则它在回归直线下方的概率为________.16.某商场为了了解某品牌羽绒服的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y=b^x+a^中b^≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月羽绒服的销售量约为________件.三、解答题(共70分,解答应写出文字说明、证明过程或演算步骤)17.(10分)观察两相关变量得如下数据:求两变量间的线性回归方程.详解答案9.C10.A 线性回归方程必过样本点的中心.x=3+4+5+64=4.5. y =0.7×4.5+0.35=3.5.又y =2.5+m +4+4.54.∴2.5+m +4+4.54=3.5.解得m =3.11.A ∵x =0+1+3+44=2, y =2.2+4.3+4.8+6.74=4.5∴4.5=0.95×2+a ,解得a =2.6.∴y ^ =0.95x +2.6.当x =10时,y ^ =0.95×10+2.6=12.1.12.C K 2=(45+10+30+15)(45×15-30×10)2(45+10)(30+15)(45+30)(10+15)=100×375×37555×45×75×25=10033≈3.030>2.706,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.13.0.64解析:因为身高解释了64%的体重变化,所以R 2≈0.64.14.1解析:残差平方和越小,模型的拟合效果越好,R 2越接近于1,当残差e i 恒为0时,R 2=1.15.13解析:由表中数据计算得x =8.5,y =80,又y ^=-20x +a ^,∴a ^=80+20×8.5=250,∴y ^=-20x +250.代入表中x 的值计算得(8,90),(8.2,86),(8.4,82),(8.6,78),(8.8,74),(9,70),与表中(x ,y )比较知,点(8.2,84),(9,68)在回归直线的下方,故所求的概率为P =26=13. 16.46解析:x =14(17+13+8+2)=10, y =14(24+33+40+55)=38. 由题意得38=-2×10+a ^ ,∴a ^=58.y ^ =-2x +58.当x =6时,y ^ =46.17.解:由表中数据计算得: x =0,y =0,∑10i =1x 2i =110,∑10i =1x i y i =330. ∴b ^ =∑10i =1x i y i -5x y ∑10i =1x 2i -5x 2=188110≈1.71, a ^=y -b x =0,∴所求线性回归方程为y ^=1.71x .18.(12分)(2016·江西省樟树中学期末)十八届五中全会公报指出:努力促进人口均衡发展,坚持计划生育的基本国策,完善人口发展战略,全面实施一对夫妇可生育两个孩子的政策,提高生殖健康、妇幼保健、托幼等公共服务水平.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了100位30到40岁的公务员,得到情况如下表:(1)是否有95%以上的把握认为“生二胎与性别有关”,并说明理由;(2)把以上频率当概率,若从社会上随机抽取3位30到40岁的男公务员,记其中生二胎的人数为X ,求随机变量X 的分布列,数学期望.⎝⎛⎭⎪⎫附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ) P (k 2≥k 0)0.050 0.010 0.001 k 0 3.841 6.635 10.82819.(12分)(2016·全国卷Ⅲ)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i-y -)2=0.55,7≈2.646. ( 参考公式:相关系数r =∑i =1n (t i -t -)(y i -y -)∑i =1n (t i -t -)2∑i =1n (y i -y -)2,回归方程y ^=a ^+b ^t中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n (t i -t -)(y i -y -)∑i =1n (t i -t -)2,a ^=y -b ^t -. )20.(12分)一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)已知y 对x 有线性相关关系,求回归直线方程;(2)在实际生产中,预测每小时的产品中有缺点的零件为89个时,机器的运转速度是多少.(参考数值:∑i =15x i y i =1 380,∑i =15x 2i =145)详解答案18.解:(1)由于K 2=n ·(ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(40×20-20×20)260×40×60×40=259<3.841,故没有95%以上的把握认为“生二胎与性别有关”.(2)由题意可得,男公务员生二胎的概率为4060=23,X ~B ⎝ ⎛⎭⎪⎪⎫3,23,X 的分布列为E (X )=3×23=2.19.解:(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17(y i -y )2=0.55,∑i =17 (t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,∴r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331,及(1)得b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=2.8928≈0.103, a ^ =y -b ^t ≈1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t , 将2016年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.20.解:(1)∵x =5,y =50.∑i =15x i y i =1 380,i =15x 2i =145.∴b ^=1 380-5×5×50145-5×5×5=6.5.a ^ =y -b ^x =17.5.∴回归直线方程为y ^=6.5x +17.5. (2)令6.5x +17.5=89. 解得x =11.即机器的运转速度是11转/秒.21.(12分)(2016·湖北省天门市、仙桃市、潜江市联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从兴趣小组中按分层抽样方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)(1)能否据此判断有97.5%的把握认为视觉和空间想象能力与性别有关?附表及公式:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.(2)现从选择做几何题的8名女同学中任意抽取2名同学对他们的答题情况进行全程研究,记丙,丁2名女生被抽到的人数为X,求X的分布列和数学期望E (X ).22.(12分)由某种设备的使用年限x i (年)与所支出的维修费y i (万元)的数据资料算得如下结果,∑5i =1x 2i =90,∑5i =1x i y i =112,∑5i =1x i =20,∑5i =1y i =25.(1)求所支出的维修费y 对使用年限x 的线性回归方程y ^=b ^x +a ^;(2)①判断变量x 与y 之间是正相关还是负相关;②当使用年限为8年时,试估计支出的维修费是多少.附:在线性回归方程y ^=b ^x +a ^中,b ^=∑ni =1x i y i -n xy ∑n i =1x 2i -n x 2,a ^=y -b ^x ,其中x ,y 为样本平均值.详解答案21.解:(1)由表中数据,得K 2=50×(22×12-8×8)230×20×30×20=509≈5.556>5.024,所以有97.5%的把握认为视觉和空间想象能力与性别有关.(2)由题设可知,在选择做几何题的8名女生中任意抽取2名的方法共有C 28=28种.其中丙、丁2人没有被抽到的方法有C 26=15种;恰有1人被抽到的方法有C 12C 16=12种;2人都被抽到的方法有1种,所以X 的可能取值为0,1,2,P (X =0)=1528,P (X =1)=1228,P (X =2)=128,X 的分布列为∴E (X )=0×1528+1×37+2×128=12.22.解:(1)∵∑5i =1x i =20,∑5i =1y i =25, ∴x =15∑5i =1x i =4,y =15∑5i =1y i =5.∴b^=∑5i=1x i y i-5x y∑5i=1x2i-5x2=112-5×4×590-5×42=1.2,a^=y-b^x=5-1.2×4=0.2,∴线性回归方程y^=1.2x+0.2.(2)①由(1)知b^=1.2>0,∴变量x与y之间是正相关.②由(1)知,当x=8时,y^=9.8(万元),即使用年限为8年时,支出的维修费用约是9.8万元.。