当前位置:文档之家› 2021届一轮复习人教A版 用样本估计总体 学案

2021届一轮复习人教A版 用样本估计总体 学案

2021届一轮复习人教A 版 用样本估计总体 学案1.用样本的频率分布估计总体分布 (1)作频率分布直方图的步骤。

①求极差(即一组数据中最大值与最小值的差)。

②决定组距与组数。

③将数据分组。

④列频率分布表。

⑤画频率分布直方图。

(2)频率分布折线图和总体密度曲线。

①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。

②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。

(3)茎叶图。

茎是指中间的一列数,叶是从茎的旁边生长出来的数。

2.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数。

(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。

(3)平均数:x -=x 1+x 2+…+x nn,反映了一组数据的平均水平。

(4)标准差:是样本数据到平均数的一种平均距离,s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]。

(5)方差:s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数)。

1.频率分布直方图中各小矩形的面积之和为1。

2.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数。

(2)中位数左边和右边的小长方形的面积和是相等的。

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。

3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a 。

(2)数据x 1,x 2,…,x n 的方差为s 2。

①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2。

一、走进教材1.(必修3P 65例题改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人。

解析 由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为:0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25。

答案 252.(必修3P 82A 组T 6改编)甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:甲 0 1 0 2 2 0 3 1 2 4 乙 2 3 1 1 0 2 1 1 0 1 则机床性能较好的为________。

解析 因为x 甲=1.5,x 乙=1.2,s 2甲=1.65,s 2乙=0.76,所以s 2乙<s 2甲,所以乙机床性能较好。

答案 乙 二、走近高考3.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________。

解析 由茎叶图可得分数的平均数为 89+89+90+91+915=90。

答案 904.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)。

若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( )A .3,5B .5,5C .3,7D .5,7解析 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3。

答案 A 三、走出误区微提醒:①平均数与方差的性质理解出错;②中位数、众数、平均数的求法不清导致出错。

5.若数据x 1,x 2,x 3,…,x n 的平均数x -=5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( )A .5,2B .16,2C .16,18D .16,9解析 因为x 1,x 2,x 3,…,x n 的平均数为5,所以x 1+x 2+x 3+…+x nn=5,所以3x 1+3x 2+3x 3+…+3x nn+1=3×5+1=16,因为x 1,x 2,x 3,…,x n 的方差为2,所以3x 1+1,3x 2+1,3x 3+1,…,3x n +1的方差是32×2=18。

故选C 。

答案 C6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x -,则m ,n ,x -的大小关系为________。

(用“<”连接)解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5;x -=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97。

故n <m <x -。

答案 n <m <x -考点一频率分布直方图【例1】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90]。

并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等。

试估计总体中男生和女生人数的比例。

解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4。

所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4。

(2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5。

所以总体中分数在区间[40,50)内的人数估计为400×5100=20。

(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60。

所以样本中分数不小于70的男生人数为60×12=30。

所以样本中的男生人数为30×2=60, 女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2。

所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2。

1.绘制频率分布直方图时需注意的两点(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; (2)频率分布直方图的纵坐标是频率组距,而不是频率。

2.与频率分布直方图计算有关的两个关系式 (1)频率组距×组距=频率; (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数。

【变式训练】 (2019·贵阳监测考试)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )A .15B .18C .20D .25解析 根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是400.4=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15。

故选A 。

答案 A 考点二茎叶图【例2】 (2019·郑州质量预测)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为( )A .49B .2C .94D .9解析 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1。

由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4。

由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a +4b =⎝ ⎛⎭⎪⎫1a +4b ×⎝ ⎛⎭⎪⎫a 4+b 4=14⎝ ⎛⎭⎪⎫1+b a +4a b +4≥14×(5+4)=94(当且仅当b =2a 时取等号)。

故1a +4b 的最小值为94。

故选C 。

答案 C1.由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断。

2.茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图中的数据求出样本数据的数字特征,进一步估计总体情况。

【变式训练】 (1)(2019·长春质量监测)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )A.95,94 B.92,86C.99,86 D.95,91(2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示。

若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,假设抽到的第一个数据是133,则这7人的平均成绩为________。

解析(1)由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86。

故选B。

(2)依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5人。

相关主题