经济数学基础第8章数据处理
第二单元直方图
一、学习目标
了解用直方图的方法处理数据.
二、内容讲解
当数据很多的时候,如何来处理数据?这包括两个方面的问题:从一个角度来说,若数据很多,计算数据的平均数和方差是很麻烦的,或者说不必要计算精确的特征数;第二个问方面,我们不满足计算数据的特征数,我们还要知道数据的全貌.
这就是频数分布标和频数直方图要解决的问题。
先看一个例子.
如果数据很多,如何了解它的分布?先讲一个例子.
例某食品厂用自动打包机包装食盐,为了解机器的生产状况,现抽取120袋食盐测试重量,具体数值如下:
经济数学基础 第8章 数据处理
第1步:确定全部数据所在的范围.
第2步:分组,确定组距和组限。
每组数据的组上限与组下限之差称为组距,即组距=组上限 - 组下限.
第3步:唱票,数出落在每组中的数据个数,这个数据个数称为组频数. 第4步:计算每组的组中值和组频率
各组的组频数与总频数之比n i
ν,称为该组的组频率
组上限与组下限的均值称为组中值,即组中值=组下限组上限
2+
这样,就得到数据的频数分布表: 频数分布表
第5步建立坐标系,画出直方图。
用数据作横轴,用频数作纵轴. 通过上面的例子,归纳列频数分布表、画频数直方图的步骤:
经济数学基础第8章数据处理
①找出数据中的最小值和最大值,确定数据所在的区间 (a,b);
②把(a,b)分组;
③计算组频数;
④计算组中值和组频率;
⑤建立坐标系,画出频数直方图.
大家可以看到,频数直方图既可以直观、简便地反映数据的全貌,又可以计算我们所需要的数据的特征数,大家可以想一想,我们也可以用频率来反映数据的全貌,这就是频率直方图.频率直方图是用数据作横轴、频率/组距作纵轴画出的直方图.
我们再看原来的例子:计算频率/组距的值填入表中:
以组距为底,以频率/组距为高画小矩形,从而画出频率直方图.
频率直方图
·以数据为横轴
·以频率/组距为纵轴
频率直方图中的小矩形的面积就等于有百分之多少的数据落在该区间内,整个直方图的面积总和应等于1.
三、例题讲解
例题有15个数据
经济数学基础 第8章 数据处理
101 114 106 118 108
117 111 114 110 104
114 108 107 113 114
(1)列出频数分布表,并画出频数直方图; (2)计算均值和方差.
解:这组数据中的最小值是101,最大值是118,确定区间为(100,120),分4组,组距=5,列表:
画出直方图.
计算特征数
利用频数分布表可以得到近似计算均值、方差的简便方法:
27.05.10713.05.102⨯+⨯≈x 13.05.11747.05.112⨯+⨯+=110.5
=2s (102.5-110.5)2×0.13+(107.5-110.5)2×0.27+(112.5-
110.5)2×0.47+(117.5-110.5)2×0.13=19
四、课堂练习
经济数学基础第8章数据处理下表是某城市30年(1967年~1996年〕的年降水量的资料(mm).将表中的数据分成5组,取a=770.0,b=1510.0.列出这些数据的频数分布表,画出频数直
方图和频率直方图,并计算均值和方差.
作频数分布表时,首先要确定数据所在的范围;其次分组,确定组距和组限;然后数出组频数;
最后计算每组的组中值和组频率,将它们分别填入表内,就得到频数分布表.
画频数直方图和频率直方图时,要注意小矩形的底都是组距,高分别是组频数和组频率/组距(而不是组频率). a,b的确定要保证所有的数据都落在[a,b]内,且分组后最小值应落在第1
组内,最大值应落在最后一组内. 找出数据中的最大值和最小值,最大值是1508.7,最小值
是772.3,a取略小于772.3的770,b取略大于1508.7的1510.0.这样所有数据都落在[a,b]内
了.B),C)都不能使所有的数据落在其中,D) 的范围太大了,分组后,第1组可能会没有值,
因此只有A)合适
五、课后作业
调查某企业100名职工的月收入(单位:元),具体数据见下表。
试就这100个数据
(1)列出频数分布表;
(2)作出频数直方图;
(3)作出频率直方图;
(4)近似计算均值、方差和标准差.
经济数学基础第8章数据处理
分10组,a=450,b=1200, 列频数分布表如下。