统计与统计案例A 级 基础一、选择题1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( )A .860B .720C .1 020D .1 0402.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( )A .13B .19C .20D .513.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^=mx +0.35,则预测2019年捐赠的现金大约是( )A.5万元C .5.25万元D .5.5万元4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5 B.5,5 C.3,7 D.5,75.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下:记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是()A.a=0.015,s21<s22B.a=0.15,s21>s22C.a=0.015,s21>s22D.a=0.15,s21<s22二、填空题6.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.7.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.8.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:分类女男总计喜爱402060不喜爱203050总计6050110________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.参考附表:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828,其中n (参考公式:K2=(a+b)(c+d)(a+c)(b+d)=a+b+c+d)三、解答题9.微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别”有关?10.(2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数1324926 5日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6) 频数15131016 5布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).B 级 能力提升11.对某两名高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如下折线图,下面是关于这两位同学的数学成绩分析.①甲同学的成绩折线图具有较好的对称性,故平均成绩为130分;②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间[110,120]内;③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关;④乙同学连续九次测验成绩每一次均有明显进步. 其中正确的结论,有________(填写正确的序号).12.(2019·天一大联考)某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(1)设消费者的年龄为x ,对该款智能家电的评分为y .若根据统计数据,用最小二乘法得到y 关于x 的线性回归方程为y ^=1.2x +40,且年龄x 的方差为s 2x =14.4,评分y 的方差为s 2y =22.5.求y 与x 的相关系数r ,并据此判断对该款智能家电的评分与年龄的相关性强弱;(2)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.分类 好评 差评 青年 8 16 中老年206附:线性回归直线y ^=b ^x +a ^的斜率b ^=;相关系数r = .独立性检验中的K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d .临界值表:P (K 2≥k 0)0.050 0.010 0.001 k 03.8416.63510.828A 级 基础一、选择题1.解析:依题意,分层抽样比为301 200=140.所以81=140(1 000+1 200+n ),解得n =1 040.答案:D2.解析:由系统抽样的原理知,抽样的间隔为52÷4=13,故抽取的样本的编号分别为7,7+13,7+13×2,7+13×3,即7号,20号,33号,46号.所以样本中还有一位同学的编号为20号. 答案:C3.解析:由统计表格,知x -=4.5,y -=3.5, 所以3.5=4.5m +0.35,则m =0.7, 因此y ^=0.7x +0.35,当x =7时,y ^=0.7×7+0.35=5.25(万元), 故2019年捐赠的现金大约是5.25万元. 答案:C4.解析:由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y =5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有56+62+65+74+70+x5=66,解得x =3.答案:A5.解析:由(0.020+0.010+0.030+a +0.025)×10=1,得a =0.015.根据频率分布直方图,乙中较稳定,则s 21>s 22.答案:C 二、填空题6.解析:x -=10×0.97+20×0.98+10×0.9910+20+10=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98. 答案:0.987.解析:依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据.在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人.答案:48.解析:根据列联表中数据,可得K 2的观测值k =110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(约有99%的把握)认为“喜爱该节目与否和性别有关”.答案:0.01 99% 三、解答题9.解:(1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76(小时). (2)由已知得:2(0.04+a +0.14+2×0.12)=1, 解得a =0.08. 由题设条件得列联表男性 38 12 50 女性 30 20 50 总计6832100所以K 2=(a +b )(c +d )(a +c )(b +d )=100(38×20-30×12)250×50×68×32≈2.941>2.706.所以有90%的把握认为“微信控”与“性别”有关. 10.解:(1)所求的频率分布直方图如下:(2)根据以上数据,该家庭使用节水龙头后,日用水量小于0.35 m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天的日用水量的平均数为x -1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头后50天的日用水量的平均数为 x -2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m 3).B 级 能力提升11.解析:①甲同学的成绩折线图具有较好的对称性,最高130分,平均成绩低于130分,①错误;②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间[110,120]内,②正确;③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关,③正确;④乙同学在这连续九次测验中第四次、第七次成绩较上一次成绩有退步,故④不正确.答案:②③12.解:(1)相关系数r ===b ^·50s 2x 50s 2y=1.2×1215=0.96. 故对该款智能家电的评分与年龄的相关性较强.(2)由2×2列联表得K 2=50×(8×6-20×16)224×26×28×22≈9.624>6.635. 故有99%的把握认为对该智能家电的评价与年龄有关.。