当前位置:文档之家› 统计数据的特征描述

统计数据的特征描述


金融广告
9
0.045
4.5
房地产广告 16 0.080
8.0
招生招聘广告 10 0.050
5.0
其它广告
集中趋势 (central tendency) 是指一组数据向某一中 心值靠拢或集中的程度
用途:是为了表示社会经济现象总体各单位某一 标志在一定时间、地点和条件下达到的一般 水平,经常被作为评价事物和决策的数量标 准或参考。
主要测度值:平均数、众数、中位数、分位数
3.1.1 平均数
平均数常用 x 来表示。是数据集中趋势的最主要测度值。
2) 加权几何平均数
计算公式:
n
G


i 1
fi
x1
f1
x2
f2
...xn
fn
fi xi fi
例题见P46
平均值计算结果的说明
(1)根据原始数据和分组资料计算的结果一般不 会完全相等,根据分组数据只能得到近似结果。
(2)只有各组数据在组内呈对称或均匀分布时, 根据分组资料的计算结果才会与原始数据的计算 结果一致。
2.调和平均数(harmonic mean)
1)简单调和平均数 简单调和平均数是各观测值倒数ห้องสมุดไป่ตู้算术平均数的倒数
适用:未经分组整理的原始数据资料
计算公式:
1
n
n
H


1 1 ... 1 1 1 ... 1 n 1
x1 x2
xn x1 x2
xn i1 xi
n
2) 加权调和平均数
0.027
0.298
1.236
0.848
0.610
0.468
x =0.027+0.298+1.236+0.848+0.610+0.468=3.487
即职工的平均家庭人口数是3.487人
已整理的组距式分组数据平均数算例
根据第2章中的表2-7中的数据资料计算某单位某种 产品平均销售量的近似值。(见课本P43)
加权算术平均数:是通过各组标志值与各组频数相乘 的总和除以各组频数之和得到的。
适用:已经分组整理并编制出频数分布的数据资料。
计算公式为
n

xi fi
x i1
n
fi
i 1

n
xi
fi
n
i 1
fi
i 1
式中,x i是单项式分组形式下第i组的变量值或组距式
分组形式下第i组的组中值;f i是第i组的频数;n为
适用:未经分组整理的原始数据资料。
计算公式:直接将各个数据相加,再除以数据个数。 其计算公式为

x

1 n
n i 1
xi
式中,xi 是一组样本数据的观测值,n为样本容量。
【例3.1】 某班级20名学生的期末数学成绩是67、 78、49、56、98、87、62、100、73、45、70、 44、96、80、49、61、60、88、93、60(分),求 该班学生的数学成绩的平均数。
第3章 统计数据的特征描述
3.1 集中趋势的描述 描述集中趋势的几个统计量及相互关系 3.2 离散程度的描述 描述离散程度的几个统计量 3.3 分布形态的描述 描述分布形态的几个统计量
数据的特征和测度
集中趋势
数值平均值
均值
位置代表值
众数 中位数
离散程度
分布的形状
方差和标准差
偏度
全距
峰度
§3.1 集中趋势的描述
适用:数值型数据(不适用于分类数据和顺序数据)
算术平均数
简单算术平均值 加权算术平均值
常用形式:调和平均数
简单调和平均数 加权调和平均数
几何平均数
简单几何平均数 加权几何平均数
简单 平均数
加权 平均数
1.算术平均数(mean)
1) 简单算术平均数
简单算术平均数就是全部数据的算术平均数。
算术平均数的若干数学性质 (1)平均数与总体单位数的积等于总体标志总量 (2)若每个变量值 (X )加减一任意常数α,则平均数也 加减这个任意值α 。 (3)若每个变量值 (X)乘以一任意常数α,则平均数也乘 以这个任意值α 。 (4)若每个变量值( X)除以一任意常数α,则平均数也除 以这个任意值α 。 (5)各个变量值(X)与算术平均数的离差和为零。 (6)各个变量值(X)与算术平均数的离差平方和为最小值。
适用:已经分组整理并编制出频数分布的数据资料。
计算公式:
H
m1 m2 ... mn
m1 m2 ... mn
x1
x2
xn
n
mi

i 1
n mi
x i1 i
mi
表示第i个单位或第i组标志值对应的标志总量, L
当各组标志总量相等,即m1=m2=…=mn= m时,即
n
mi
组数。
已整理的单项式分组数据平均数算例
表 3-1 职工家庭平均人口数的辅助计算表
家庭人口数
xi
1 2 3 4 5 6
频数(职工户数)
fi
7 38 105 54 31 20
频率 fi n fi i 1
0.027 0.149 0.412 0.212 0.122 0.078
xi
fi
n
fi
i 1
解:由公式(3.1)
x
=
1 (67 + 78 + 49 + 56 + 98 + 87 + 62 20
+ 100 + 73 + 45 + 70 + 44 + 96 + 80
+ 49 + 61+ 60 + 88 + 93 + 60)分
= 70.8分
该班学生的数学平均成绩是70.8分。
2) 加权算术平均数
H i1
n mi
x i1 i
nm
n 1
m x i1 i
n
n 1
x i1 i
例题见课本P44
3.几何平均数(geometric mean)
适用:计算平均比率和平均速度,即用于时间上有
联系或有先后顺序关系的比率求平均。
1) 简单几何平均数
计算公式:
1
G n x1x2...xn (xi ) n
数值平均值 总结
特点: •最常用的测度值 •均值利用了全体数据 •易受数据中极端值的影响 •用于数值型数据,而不能用于分类数据和顺序数据
3.1.2 众数 众数(mode)是数据中出现次数最多的那个观测值,也 就是是频数分布中频数或频率最大的数值,一般用M0 表示。 适用:分类数据、顺序数据以及数值型数据。
1.根据品质型和单项式分组数据计算众数
2.根据组距式分组数据计算众数
① 要确定众数所在组,即众数组。 ② 通过下面的下限公式或上限公式来计算众数。
品质数列的众数(算例)
某城市居民关注广告类型的频数分布
广告类型 人数 比例 频率(%)
商品广告 112 0.560
56.0
服务广告 51 0.255
25.5
相关主题