当前位置:
文档之家› 用直方图算平均数-中位数、众数、标准差
用直方图算平均数-中位数、众数、标准差
练习 课本P74 练习
选择平均数更好:因为,此时的众数20万比中位 数25万还小,所以众数代表的是局部的数。中位数代表 的虽然是大多数公路投资的数额,但由于其不受极端值 的影响,不能代表全体,因而此时成了它的缺点。选择 平均数较好,能比较好的代表整体水平,但缺点是仍不
三种数字特征的优缺点
特征数 众数
平均数向我们提供了样本数据的重要信 息,但是,有时它也会影响我们,使我们对 总体作出片面判断。平均数反映数据的集中 趋势,但是,只有平均数还难以概况样本数 据的实际状态。当样本的平均数相等或相差 无几时,就要用样本数据的离散程度来估计 总体的数字特征。这时,我们引进了一个概 念:标准差!
12
标准差
面积和=0.49 0.5
后四个小矩形的 面积和=0.26
0.4
0.25
0.3 0.22
0.2 0.15
0.1
0.08
0.04
0
0.5 1
1.5
0.14
2
2.5
2.0
0.06 0.04 0.02
3
3.5
4 4.5
月均用水量/t
思考:平均数是频率分布直方图的“重心”,
在城市居民月均用水量样本数据的频率分布
1、众数 在一组数据中,出现次数最多 的数据叫做这一组数据的众数.
2、中位数 将一组数据按大小依次排列, 把处在最中间位置的一个数据(或两个数据 的平均数)叫做这组数据的中位数.
3、平均数 (1) (2)
x = (x1+x2+……+xn) /n x = x1f1+x2f2+……+xkfk
思考 如何从频率分布直方图中估计众数、
2.平均数对数据有“取齐”的作用,代表一组数据 的平均水平。 3.标准差描述一组数据围绕平均数波动的大小,反 映了一组数据变化的幅度。
有两位射击运动员在一次射击测试中各射 靶十次,每次命中的环数如下:
如果你是教练,你应当如何对这次射击情况作出 评价?如果这是一次选拔性考核,你应当如何作出选 择?
标准差
标准差是样本数据到平均数的一种平均距 离.它用来描述样本数据的离散程度.在实际应 用中,标准差常被理解为稳定性.
1、平均距离
标准差
中位数、平均数呢?
众数:最高矩形的中点的横坐标 2.25
频率
中位数:左右两边直方
组距
图的面积相等.
2.02
0.5
平均数:频率分布直方
0.44
图中每个小矩形的面
0.3 0.28 0.16
积乘以小矩形底边中
点的横坐标之和. 2.02
0.08 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
3、算出 xi -x 2 i=1, 2,…,n ,这n个数的 平均数,即为样本方差 s 2
4、算出方差的算术平均值,即为样本标准差s。
s2
=
1 n
x1-x
2
x2-x
2
x3-x
2 …
xn -x
2
1 n
= n i=1
xi -x
2=1 nx12 Nhomakorabeax
2 2
x
2 3
…
xn2
-n
81 练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:
平均失球数
平均失球个数的标准差
甲
1. 5
1. 1
乙
2. 1
0. 4
1、平均来说,甲的技术比乙的技术好; 2、乙比甲技术更稳定;
全对 3、甲队有时表现差,有时表现好; 4、乙队很少不失球。 24
小结
1.用样本的数字特征估计总体的数字特征分两类: a.用样本平均数估计总体平均数。 b.用样本标准差估计总体标准差。样本容量越大, 估计就越精确。
标准差是样本数据到平均数的一种平均距离.它 用来描述样本数据的离散程度.在实际应用中,标准 差常被理解为稳定性.
规律:标准差越大,
大则a越大,数据的 离散程度越大;反
之,数据的离散程
度越小.
计算标准差的算法:
1、算出样本数据的平均数 x
2、算出每个样本数据与样本平均数的差
xi -x i=1, 2,…,n
x
2 16
注意:
1、标准差、方差的取值范围: 0,+
当标准差,方差为0时,样本各数据全相等,表 明数据没有波动幅度,数据没有离散性。
2、因为方差与原始数据的单位不同,且平方后可 能增大了偏差的程度,所以虽然方差与标准差在 刻画样本数据的离散程度上是一样的,但在解决 实际问题时,一般采用标准差。
1
问题
在一次射击比赛中,甲、乙两名运动员各射击 10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥 的更稳定些吗?
为了从整体上更好地把握总体的规律,我们要通 过样本的数据对总体的数字特征进行研究。——用样 本的数字特征估计总体的数字特征。
直方图中,各个小矩形的重心在哪里?从直
方图估计总体在各组数据内的平均数分别为 频率 多少?
0.5 组距
0.4
0.3
0.2
0.O1
0.5 1 1.5 2 2.5 3 3.5 4 4.5
0.25,0.75,1.25,1.75,2.25,
2.75,3.25,3.75,4.25.
月均用水量/t
3 、平均数 平均数的估计值等于每个小矩形的面积
从生产的零件内径的尺寸来看,谁生产的质量较高?
X甲≈25.401 X乙≈25.406 s甲≈0.037 S乙≈0.068
从样本平均数看,甲生产的零件内径比 乙更接近内径标准,但是差异很小;
从样本标准差看,由于s甲<S乙,因 此甲生产的零件内径比乙的稳定程度高很 多。于是,可以作出判断,甲生产的零件 的质量比乙的高一些。
乘以小矩形底边中点的横坐标之和
0.25×0.04+0.75×0.08+1.25×0.15+1.75 ×0.22+2.25×0.25+2.75×0.14+3.25×
0.06+3.75×0.04+4.25×0.02=2.02(t). 平均数是2.02.
平均数: x = x1f1+x2f2+……+xkfk
优点
缺点
体现了样本数据的最大 无法客观反映总体
集中点
特征
中位数 不受少数极端值的影响 不受少数极端值的
影响有时也是缺点
平均数
与每一个数据有关,更 受少数极端值的影 能反映全体的信息. 响较大,使其在估
计总体时的可靠性 降低.
探究
一个企业中, 有职工的人数很多,他 们的月收入是两千左右,然后有少数人员是 经理以上层次的人,他们的月收入是三万左 右。如果是你老板,去招聘时,回答有关工 资待遇方面的问题,你更愿意用哪个数字特 征来回答这个问题呢?如果你是应聘者,你 更愿意希望老板是用哪个特征数字来回答?
17
例1:画出下列四组样本数据的直方图,说 明它们的异同点.
(1)
(2)
(3)
(4)
例2:甲乙两人同时生产内径为25.40mm的一种零件. 为了对两人的生产质量进行评比,从他们生产的零件 中各抽出20件,量得其内径尺寸如下(单位:mm )
甲
X甲≈25.401
s甲≈0.037
乙
X乙≈25.406
S乙≈0.068
如何在频率分布直方图中估计众数
频率
组距 众数在样本数据的频率分布直方图中,
就是最高矩形的中点的横坐标。
0. 05.4
0.3
0.2
0.
1
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5
月平均用水
量(t)
可将众数看作直方图中面积最大长方形的“中心”
频率
如何在频率分布直方图中估计中位数
组距
0.6 前四个小矩形的
20
练习 课本P79 练习
解: 依题意计算可得
x1=900
x2=900
s1≈23.8 s2 ≈42.6
甲乙两种水稻6年平均产量的平均数相同, 但甲的标准差比乙的小,所以甲的生产比较稳 定.
22
解 : (1) 平均重量约为496.86 g , 标准差约为6.55
(2)重量位于(x-s , x+s)之间有14袋白糖,所占 百分比为66.67%.