当前位置:文档之家› 2018年高考数学总复习 统计与统计案例

2018年高考数学总复习 统计与统计案例

第三节 统计与统计案例考纲解读1. 理解随机抽样的必要性和重要性。

2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。

3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点。

4. 理解样本数据标准差的意义和作用,会计算数据标准差。

5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。

6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。

7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。

8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。

9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。

(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。

(2)回归分析了解回归分析的基本思想、方法及其简单应用。

命题趋势探究1. 本节内容是高考必考内容,以选择题、填空题为主。

2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。

(1)(2)有结合趋势,考题难度中下。

3. 统计案例为新课标教材新增内容,考查考生解决实际问题的能力。

知识点精讲 一、抽样方法三种抽样方式的对比,如表13-7所示。

(1)样本平均值:11ni i x x n ==∑。

(2)样本众数:样本数据中出现次数最多的那个数据。

(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。

(4)样本方差:()2211ni i s x x n ==-∑。

众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。

三、频率分布直方图的解读 (1)频率分布直方图的绘制①由频率分布表求出每组频数n i ;②求出每组频率ii n P N=(n 为样本容量); ③列出样本频率分布表; ④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。

(2)样本估计总体步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。

样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。

(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。

公式:aX b ax b +=+,s 2(aX +b )=a 2s 2(X )。

四、线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。

对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程y bx a =+的求法为()()()1122211n ni i i i i i n ni ii i x x y y x y nx y b x x x nx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ 其中,11n i i x x n ==∑,11ni i y y n ==∑,(x ,y )称为样本点的中心。

步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率k >0,称两个变量正相关;k <0,称两个变量负相关。

五、独立性独立性检验是判断两个分类变量是否存在相关关系的案例分析方法。

步骤为列出2⨯2列联表(如表13-8所示),求出()()()()()22n ad bc K a b c d a c b d -=++++,并判断:表若K 21212若10.828≥K 2>6.635,有99%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;若6.635≥K 2>3.841,有95%把握称“A 取A 1或A 2”对“B 取B 1,B 2”有关系;若K 2≤3.841,没有把握称A 与B 相关。

题型归纳及思路提示 题型181 抽样方式 思路提示根据所抽取的对象与要求,若抽取的对象中有明显差异,考虑用分层抽样,否则选择简单随机抽样或系统抽样。

当总体中的个体较少时,常采用简单随机抽样;当总体中的个体较多时,常采用系统抽样。

例13.16(2012天津理9)某地区有小学150所,中学75所,大学25所。

现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调査,应从小学中抽取 所学校,中学中抽取 所学校。

解析:本地区共有学校150+75+25=250(所),所以从小学中应抽取1503018250⨯=(所),从中学中抽取75309250⨯=(所)。

变式1 (2012山东理4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9。

抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C 。

则抽到的人中,做问卷B 的人数为( )。

A. 7B. 9C. 10D. 15变式2 某校共有学生2000名,各年级男、女生人数如表13-9所示,已知在全校学生中任取一名,抽到二年级女生的概率为0.19,现用分层抽样的方法,在全校抽取64名学生,则应在三年级抽取的学生人数为( )。

表13-9一年级 二年级 三年级女生 373x y 男生 377 370z 变式3 某企业三月中旬生产A ,B ,C 三种产品其3000件,根据分层抽样的结果,企业统计员制作了统计表格,如表13-10所示,由于不小心,表格中的A ,C 产品的有的有关数据被污染看不清楚,统计员记得A 产品样本容量比C 产品的样本容量多10,由此可得C 产品数量为_______。

表13-10产品类型A B C 产品数量(件) 1300 产品样本数量(件) 130题型182 样本分析——用样本估计总体 思路提示对样本进行分析并用样本估计总体,包括用样本数字特征估计总体数字特征和用样本的频率分布估计总体的频率分布。

在进行样本分析时,应从统计图表中获取数据。

体现在以下几个方面:(1)在频率分布直方图中,长方形面积=组距⨯频率组距=频率,即随机变量的概率;(2)对于频数、频率、样本容量,已知其二必可求第三个;(3)随机变量在各组数据内的频数之和为样本容量。

例13.17(2013广东理17)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图13-16所示,其中茎为十位数,叶为个位数。

17920153013-16图(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人;(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率。

分析:阅读茎叶图得出样本数据,利用平均数公式计算出样本均值。

(2)根据样本算出优秀工人的比例,再估计12人中优秀工人的个数。

(3)用组合数公式求出所有可能的组合的个数和符合条件“恰有1名优秀工人”的组合的个数,利用古典概型概率公式进行计算。

解析:(1)由茎叶图可知,样本数据为17,19,20,21,25,30,则样本均值171920212530226x +++++==,故样本均值为22。

(2)日加工零件个数大于样本均值的工人有2名,故优秀工人的频率为2163=,该车间12名工人中优秀工人大约有21246⨯=(名),故该车间约有4名优秀工人。

(3)记“恰有1名优秀工人”为事件A ,其包含的基本事件个数为C 14C 18=32,所有基本事件的总数为C 212=66,由古典概型概率公式,得()32166633P A ==。

所以恰有1名优秀工人的概率为1633。

变式1 (2012陕西理6)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图13-17所示),设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )。

865088400102875220233780031244831423813-17甲乙图 A. x 甲<x 乙,m 甲>m 乙B. x 甲<x 乙,m 甲<m 乙 C .x 甲>x 乙,m 甲>m 乙D. x 甲>x 乙,m 甲<m 乙变式2 某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验。

选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙。

(1)假设n =4,在第一大块地中,种植品种甲的小块地的数目记为X ,求X 的分布列和数学期望;(2)试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm 2)如表13-11所示。

表品种甲 403 397 390 404 388 400 412 406该种植哪一品种?附:样本数据x 1,x 2,…,x n 的样本方差[()()()]2222121n s x x x x x x n=-+-++-,其中x 为样本平均数。

例13.18某次有1000人参加的数学摸底考试,其成绩的频率分布直方图如图13-18所示,规定85分及其以上为优秀。

(1)表13-12所示的是这次考试成绩的频数分布表,求正整数a ,b 的值;(2)优秀的学生人数;(3)在(2)中抽取的40名学生中,要随机选取2名学生参加座谈会,记“其中成绩为优秀的人数”为X ,求X 的分布列与数学期望。

解析:(1)由频率分布直方图可知,a =0.4⨯5⨯1000=200,b =0.02⨯5⨯1000=100。

(2)设抽取的40人中成绩为优秀的学生人数为x ,则350300100401000x ++=,解得x =30,即其中成绩为优秀的学生人数为30名。

(3)依题意,随机变量X 的可能取值为:0,1,2。

且()210240C 30C 52P X ===,()111010240C C 51C 13P X ===, ()220240C 292C 52P X ===,所以X 的分布列为:数学期望为()30125213522E X =⨯+⨯+⨯=。

变式1 某班50名同学在一次百米测试中的成绩全部介于13秒和19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒; 第二组,成绩大于等于14秒且小于15秒; ……第六组,成绩大于等于18且小于19秒。

如图13-19所示是由上述分组方法得到的频率分布直方图,设成绩小于17秒的学生占全班总人数的百分比为x ,成绩大小等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )。

相关主题