第二节 用样本估计总体
所分的组数 增
加, 组距 减小,相应的频率折线图会越来越接近于一条光滑曲线, 统计中称这条光滑曲线为总体密度曲线. (3)茎叶图的优点 茎叶图的优点是可以 保留 原始数据,而且可以 随时 记录,这 对数据的记录和表示都能带来方便.
2.样本的数字特征 (1)众数、中位数、平均数
数字特征 定义与求法 一组数据中重复出现次数 最多 的数 把一组数据按 从小到大的 中位数 优点与缺点 众数通常用于描述变量的值出现次数最多的 数. 但显然它对其他数据信息的忽视使得无法客 观地反映总体特征 中位数等分样本数据所占频率, 它不受少数几个
3.如图是 100 位居民月均用水量的频率分布直方图,则 月均用水量为[2,2.5)范围内的居民数有________人.
答案:25
4.一个容量为 200 的样本的频率分布直方图如图所示, 则样本数据落在[5,9)内的频率和频数分别为________.
答案:0.2
40
5.某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶 5.某赛季甲、乙两名篮球运动员每场比赛得分记录用茎
图表示,从茎叶图的分布情况看, ________运动员的发挥更稳定 . 表示,从茎叶图的分布情况看, ________ 运动员的发挥更稳定
答案:乙
6.将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低 分, 7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后 来有 1 个数据模糊,无法辨认,在图中以 x 表示:
B.84,85
C.86,84
D.84,86
解析:选 A 由图可知,去掉一个最高分和一个最低分后, 所剩数据为 84,84,84,86,87. 84+84+84+86+87 ∴平均数为 =85,众数为 84. 5
2.若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所 示,则这组数据的中位数和平均数分别是( )
A.91.5 和 91.5
B.91.5 和 92
C.91 和 91.5 D.92 和 92
解析:选 A
将这组数据从小到大排列,得
91+92 87,89,90,91,92,93,94,96.故中位数为 =91.5. 2 87+89+90+91+92+93+94+96 - 平均数为 x = =91.5. 8
36 答案: 7
典题 1]
[典题 1]
(1)(2015· 新课标全国卷Ⅱ)根据下面给出的 2004 年
(1)(2015· 新课标全国卷Ⅱ)根据下面给出的 2004 年
3 年我国二氧化硫年排放量 (单位:万吨 柱形图,以下结论 至 2013 年我国二氧化硫年排放量 (单位:万吨)) 柱形图,以下结论
1.频率分布直方图和茎叶图 (1)作频率分布直方图的步骤 ①求极差(即一组数据中 最大值 与最小值 的差); ②决定 组距 与 组数 ; ③将数据 分组 ; ④列 频率分布表 ; ⑤画 频率分布直方图 .
(2)频率分布折线图和总体密度曲线 ①频率分布折线图:连接频率分布直方图中各小长方形上端 的 中点 ,就得到频率分布折线图. ②总体密度曲线:随着样本容量的增加,作图时
)
中不正确的是 正确的是 ( )(
A.逐年比较,2008 年减少二氧化硫排放量的效果最显著 B.2007 年我国治理二氧化硫排放显现成效 C.2006 年以来我国二氧化硫年排放量呈减少趋势 D.2006 年以来我国二氧化硫年排放量与年份正相关
年度的消费情况进行统计,发现消费金额 ( 单位:万元 ) 都 [0.3,0.9]内,其频率分布直方图如图所示. ①直方图中的 a=________; [0.3,0.9] 内,其频率分布直方图如图所示.
②区间 [0.3,0.5) 内的频率为 0.1×1.5 + 0.1×2.5 = 0.4 ,故 [0.5,0.9]内的频率为 1-0.4=0.6. 因 此 , 消 费 金 额 在 区 间 [0.5,0.9] 内 的 购 物 者 的 人 数 为 0.6×10 000=6 000. (3) 月工资收入落在 (30,35]( 百元 ) 内的频率为 1 - (0.02 + 0.04+0.05+0.05+0.01)×5=1-0.85=0.15,则 0.15÷ 5=0.03, 所以各组的频率比为 0.02 ∶ 0.04 ∶ 0.05 ∶ 0.05 ∶ 0.03 ∶ 0.01 = 3 2∶4∶5∶5∶3∶1,所以(30,35](百元)月工资收入段应抽出 20 ×100=15(人).
答案:(1)D
(2)①3
②6 000
(3)15
1.绘制频率分布直方图时需注意: (1)制作好频率分布表后, 可以利用各组的频率之和是 否为 1 来检验该表是否正确; 频率 (2)频率分布直方图的纵坐标是 ,而不是频率. 组距
2. 由频率分布直方图进行相关计算时, 需掌握下列关系式: 频率 (1) ×组距=频率; 组距 频数 频数 (2) =频率,此关系式的变形为 =样本容量, 样本容量 频率 样本容量×频率=频数.
考纲要求: 1.了解分布的意义和作用,会列频率分布表,会画频率分布直 方图、频率折线图、茎叶图,理解它们各自的特点. 2.理解样本数据标准差的意义和作用,会计算数据标准差. 3.能从样本数据中提取基本的数字特征(平均数、标准差),并 给出合理解释. 4.会用样本的频率分布估计总体的分布,会用样本的基本数 字特征估计总体的基本数字特征,理解用样本估计总体的思想. 5.会用随机抽样的基本方法和样本估计总体的思想解决一些 简单的实际问题.
人做电话询访,则(30,35](百元)月工资收入段应抽出 ________人.
中抽出 100 _______ 人.
[听前试做]
(1)对于 A 选项,由图知从 2007 年到 2008 年二
氧化硫排放量下降得最多,故 A 正确.对于 B 选项,由图知,由 2006 年到 2007 年矩形高度明显下降, 因此 B 正确. 对于 C 选项, 由图知从 2006 年以后除 2011 年稍有上升外,其余年份都是逐年 下降的,所以 C 正确.由图知 2006 年以来我国二氧化硫年排放 量与年份负相关,故选 D. (2) ① 由 0.1×1.5 + 0.1×2.5 + 0.1a + 0.1×2.0 + 0.1×0.8 + 0.1×0.2=1,解得 a=3.
(2)标准差、方差 ①标准差:样本数据到平均数的一种平均距离,一般用 s 表 示,s= 1 -2 -2 -2 [ x 1- x +x2- x +„+xn- x ]. n
②方差:标准差的平方 s2 1 s = n [(x1 - - x )2 + (x2 - - x )2 +„+ (xn - - x )2] ,其中 xi(i =
答案:(1)A
在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个 图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶 的含义.
1.如图是 2015 年某大学自主招生面试环节中,七位评 委为某考生打出的分数的茎叶统计图, 去掉一个最高分和一 个最低分后,所剩数据的平均数和众数依次为( )
Байду номын сангаас
A.85,84
调查结果画出如图所示的频率分布直方图,为了了解工薪
(3)某地政府调查了工薪阶层 1 000 人的月工资收入,并根据 调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对
月工资收入的满意程度,要用分层抽样的方法从调查的 1
中抽出 100 人做电话询访,则(30,35](百元)月工资收入段 月工资收入的满意程度,要用分层抽样的方法从调查的 1 000 人
(3)×
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标 是众数. ( √ ) (5)× (3) × (4)
(6)√
(5)在频率分布直方图中, 众数左边和右边的小长方形的面积 和是相等的. ( × ) (2)√ 答案:(1)
(3)×
(4)√
(5)×
(6)√
(6)一组数据的方差越大,说明这组数据的波动越大. ( √ ) (5) 答案:(1)× (2)√ (3)× (4)
②在这些购物者中,消费金额在区间 [0.5,0.9]内的购物者的人数 为________ . 为________. (2)(2015· 湖北高考)某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额 ( 单位:万元 ) 都在区间
②在这些购物者中,消费金额在区间 [0.5,0.9]内的购物者 ①直方图中的 a=________;
则 7 个剩余分数的方差为________.
解析:由图可知去掉的两个数是 87,99,所以 87+ 90×2+91×2+94+90+x =91×7, 解得 1 2 x =4.s = [(87 7
-91)2 +(90- 91)2×2+ (91-91)2×2+(94- 91)2×2] = 36 . 7
众数
顺序排列,处在 中间 位置的一 极端值的影响,这在某些情况下是优点,但它对 个数据(或两个数据的平均数) 如果有 n 个数据 x1,x2,„, 极端值的不敏感有时也会成为缺点 平均数与每一个样本数据有关, 可以反映出更多
平均数
但平均数受数据中 x n, 那么这 n 个数的平均数 x = 的关于样本数据全体的信息, x1+x2+„+xn n 的极端值的影响较大, 使平均数在估计总体时可 靠性降低
2
1,2,3,„,n)是样本数据 ,n 是样本容量 ,- x 是样本平均数 .
(3)平均数、方差公式的推广 若数据 x1,x2,„,xn 的平均数为- x ,方差为 s2,则 数据 mx1+a,mx2+a,„,mxn+a 的平均数为 m- x +a, 方差为 m2s2.
[自我查验] 1. 判断下列结论的正误. (正确的打“√”, 错误的打“×”) (1)在频率分布直方图中,小矩形的高表示频率. ( × ) (2)√ 答案:(1) (2)频率分布直方图中各个长方形的面积之和为 1.( √ ) (5)× 答案:(1)× (2)√ (3)× (4) (3)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从 小到大的顺序写,相同的数据可以只记一次. ( × ) (2)√ 答案:(1)