当前位置:文档之家› 第五章 数据分布特征的描述

第五章 数据分布特征的描述

静态平均数是反映同一时间总体各单位标志值的一般 水平。例如,某企业某月职工的平均工资。
动态平均数是反映不同时间总体指标的一般水平。例 如,某企业根据某年12个月计算的职工月平均工资。
2.按计算或确定的方法不同,分为数值平均数和位 置平均数。
数值平均数是根据总体各单位的标志值计算得到的平
均值,主要有算术平均数、调和平均数、几何平均数。
解:
xH xf 30000 2.00 20000 2.50 25000 2.40 170000 2.27(元/千克) 30000 20000 25000 75000 f
练一练
已知某商品在三个集市贸易市场上的平均价格及销售额资料 如下,求该商品在市场上的总平均价格。 市场 平均价格(元/千克) 销售额(元) 2.00 60 000 甲 2.50 50 000 乙 2.40 60 000 丙 — 170 000 合计
第五章 数据分布特征的描述
学习目的和重难点提示
本章学习目的
领会数据分布的各种特征:集中趋势、离散趋势、 偏斜程度和峰度。 掌握数据分布特征各测定值的计算方法、特点及 其应用场合。 本章重难点提示 数据分布特征的描述方法,如何使用一些统计量 来对数据进行概括Байду номын сангаас测定。
数据分布特征各测定值的计算方法、特点及其应 用场合。
调和平均数也容易受极端数值的影响,而且受极小值的影响
大于受极大值的影响。调和平均数的应用范围较小,当变量
值中有一项为0时,无法计算调和平均数。
调和平均数的运用
在社会经济领域中,调和平均数经常作为算术平均数的变形
使用。主要适用于质量指标求平均。
如果知道该质量指标的分子资料,则用加权调和平均数公式 计算该指标的平均数;如果知道该质量指标的分母资料,则 用加权算术平均数公式计算该指标的平均数。
2 MO U d 1 2
式中,MO 表示众数;
L 表示众数组的下限;
U 表示众数组的上限;
△1表示众数组次数与前一组次数之差; △2表示众数组次数与后一组次数之差;
d 表示众数组的组距。
练一练
某校计算机专业毕业学生实习月工资统计如下,求众数。
月工资(元) 学生数(人) 月工资(元) 学生数(人)
调和平均数
调和平均数是总体各单位标志值倒数的算术平均 数的倒数,也称倒数平均数。
调和平均数按其计算方法不同,可分为简单调和平均数和 加权调和平均数。 n (1)简单调和平均数 xH 1

x
(2)加权调和平均数
m xf xH m f x
m表示调和平均数的权数。
调和平均数的特点
节能灯泡的使用寿命的分组数据
使用寿命(小时) 组中值 (x) 数量(f) xf 频率 (f/Σf) (Σxf/Σf)
1000以下
1000-1200 1200-1400 1400-1600 1600-1800 1800-2000 2000以上 合 计
900
1100 1300 1500 1700 1900 2100 ——
中位数的确定 (1)未分组资料确定中位数
根据未分组资料确定中位数时,首先将标志值按大小顺序
排列,然后确定中点位次Om=(n+1)÷2,再根据中位数的位次
找出对应的标志值。
当总体单位数n是奇数时,中位数即处于中间位置的变量值; 如果n是偶数时,中位数则是中间的两个数值的算术平均数。
例如: 某班7个学生的数学成绩依次排列为65分,75分,78分, 82分,89分,91分,95分,则该数列的中点位次为: Om=(7+1)÷2=4
例如,某生产小组有6人,某天生产的产品零件数分别为12件,14 件,13件,12件,16件,11件,则平均每人日生产零件数为: 78/6=13(件)
加权算术平均数
志值乘以相应的次数,然后加总求和,再除以总次数(总体 单位数),所得结果为加权算术平均数。其计算公式为:
若总体资料已经分组,编成分配数列,这时将各组标
算术平均数可分为简单算术平均数和加权算术平均数。
简单算术平均数
若总体资料未进行分组,则先计算总体标志总量,再用总体 单位数去除,计算的结果为简单算术平均数。其计算公式为:
x1 x 2 x n x x n n
式中, 表示算术平均数;x表示各单位的标志值; n表示总体 单位数;∑x表示总和。
2
8 16 35 23 12 4 100
1800
8800 20800 52500 39100 22800 8400 154200
0.020
0.080 0.160 0.350 0.230 0.120 0.040 1.000
18
88 208 525 391 228 84 1542
算术平均数的数学性质
1)各标志值与算术平均数的离差之和等于零。即 未分组资料: x x 0 分组资料:
——《报刊文摘》2007年12月5日第2版
f(x)
众数
MO
x
众数的确定
字母 MO 表示,反映一种最普遍、最常见的现象。
众数(Mode)是总体中出现次数最多的标志值,一般用
(1)单项数列确定众数 采用直接观察法确定众数。单项数列确定众数比较简单, 只需找出次数最多的标志值即为众数。例如:
住房满意程度 很不满意 户数 80 不满意 100 一般 180 比较满意 250 满意 160
第一节 数据分布集中趋势的测定
集中趋势
集中趋势是指一组数据向某一中心值靠拢的倾
向,测度集中趋势也就是寻找数据一般水平的代表 值或中心值。一般而言,集中趋势用平均指标来表 示。
平均指标
一 平均指标的概念及作用
x
平均指标是表明同质总体内某一标志在具体时
间、地点、条件下达到的一般水平的统计指标, 也称为平均数或均值。

几何平均数是n个比率乘积的n次方根,即把若干
主要用于计算现象的平均发展速度,
也适用于对某些具有环比性质的比率求平均。 几何平均数按计算方法不同分为简单几何平均数和加权几何 平均数。 xG n x1 x2 xn n x (1)简单几何平均数 (2)加权几何平均数 x f x f1 x f 2 x f n f xf
(提示:总平均价格=销售总额÷总销售量,已知分子销售总额,应用加权调 和平均数)
解:
xH
m 60000 50000 60000 170000 2.27(元/千克) m 60000 50000 60000 75000 x 2.00 2.50 2.40
几何平均数
个变量连乘,得其乘积再开n次方根。社会经济统计 中,几何平均数适用于各个变量值之间存在连乘积关 系的场合。
解:上面数列中比较满意的户数最多,即出现次数最多, 所以众数 MO为“比较满意”。也就是总体来说,该城市居 民对现有住房还是比较满意的。
(2)组距数列确定众数
首先根据出现的最多次数确定众数所在组(简称众数组),然后利用 公式计算众数的近似值。
其计算公式为: 下限公式: 上限公式:
MO L
1 d 1 2
500以下 500-800 800-1100 1 9 18 1400-1700 1700-2000 2000以上 14 7 4
1100-1400
25
合计
78
解:首先确定众数组,人数最多者为25人,对应组为11001400,则该组为总数所在组。 25 18 300 1217 (元) 根据下限公式:MO L 1 d 1100
1 2 (25 18) (25 14) MO U 根据上限公式: 2 25 14 d 1400 300 1217 (元) ( 25 18 ) ( 25 14 ) 1 2
众数的特点
• 众数是位置平均数,不受极端数值的影响。
位置平均数是根据标志值在分配数列中的位置或出现
次数的多少确定的,主要有中位数和众数。
平均指标的计算
算术平均数
算术平均数是总体单位某一数量标志值之和除以总 体单位总量(即总体单位数)。其计算公式为:
总体标志总量 算术平均数 总体单位总量
例如,某企业2006年12月职工平均人数为500人,其工 资总额为 1000000元,则该企业职工月平均工资为 2000元。
• 如果权数采用频率的形式计算时,平均数的公式变为:
f x x f
• 当权数完全相等(f1 =f2 =…= fn)时,加权算术平均数就成了 简单算术平均数,权数就失去了意义。
• 若分组资料为单项数列,则可直接按公式计算加权算术平均数; • 若分组资料是组距数列,则先计算组中值,用组中值代替各组标志值 的一般水平,再计算加权算术平均数。
• 众数只有在总体单位数多,而且具有明显的集中趋
势时,才有合理的代表性和现实意义。
• 当总体单位数少,或者总体单位数虽多,但无明显
集中趋势时,就不存在众数。
f(x)
中位数
50%
50%
Me
x
中位数(Medians)是将总体各单位的标志值按大小顺 序排列,处于数列中点位置的标志值,一般用字母Me表示。
x1 f1 x2 f 2 xn f n xf x f1 f 2 f n f
权数
• 权数——指在计算总体平均数或综合水平的过程中对 各个数据起着权衡轻重作用的变量。
• 可以是绝对数形式,也可以是比重形式(如频率)来表示。
– 事实上比重权数更能够直接表明权数的权衡轻重作用的实质。
社会经济现象用几何平均法计算平均数应满足两个条件: (1)若干个比率或速度的乘积等于总比率或总速度。 (2)相乘的各比率或速度不得为零或负值。
相关主题