当前位置:
文档之家› 统计数据的特征描述PPT课件
统计数据的特征描述PPT课件
家庭人口数
xi
1 2 3 4 5 6
频数(职工户数)
fi
7 38 105 54 31 20
频率 fi n fi i 1
0.027 0.149 0.412 0.212 0.122 0.078
xi
fi
n
fi
i 1
0.027
0.298
1.236
0.848
0.610
0.468
x =0.027+0.298+1.236+0.848+0.610+0.468=3.487
CHENLI
9
2.调和平均数(harmonic mean)
1)简单调和平均数
简单调和平均数是各观测值倒数的算术平均数的倒数
适用:未经分组整理的原始数据资料
计算公式:
H111... 1
11n... 1
n n1
x1 x2
xn x1 x2
xn i1xi
n
CHENLI
10
2) 加权调和平均数
适用:已经分组整理并编制出频数分布的数据资料。
CHENLI
11
3.几何平均数(geometric mean)
适用:计算平均比率和平均速度,即用于时间上有
联系或有先后顺序关系的比率求平均。
1) 简单几何平均数
计算公式:
1
Gn x1x2..x.n (xi)n
2) 加权几何平均数
计算公式:
n
G i1fix1f1x2f2..xn .fn fixifi
CHENLI
2
§3.1 集中趋势的描述
集中趋势 (central tendency) 是指一组数据向某一中 心值靠拢或集中的程度
用途:是为了表示社会经济现象总体各单位某一 标志在一定时间、地点和条件下达到的一般 水平,经常被作为评价事物和决策的数量标 准或参考。
主要测度值:平均数、众数、中位数、分位数
CHENLI
15
➢品质数列的众数(算例)
某城市居民关注广告类型的频数分布
广告类型 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其它广告
合计
人数 112 51
9 16 10 2 200
比例 0.560 0.255 0.045 0.080 0.050 0.010
1
频率(%) 56.0 25.5 4.5 8.0 5.0 1.0 100
即职工的平均家庭人口数是3.487人
CHENLI
8
已整理的组距式分组数据平均数算例
根据第2章中的表2-7中的数据资料计算某单位某种 产品平均销售量的近似值。(见课本P43)
算术平均数的若干数学性质 (1)平均数与总体单位数的积等于总体标志总量 (2)若每个变量值 (X )加减一任意常数α,则平均数也 加减这个任意值α。 (3)若每个变量值 (X)乘以一任意常数α,则平均数也乘 以这个任意值α。 (4)若每个变量值( X)除以一任意常数α,则平均数也除 以这个任意值α。 (5)各个变量值(X)与算术平均数的离差和为零。 (6)各个变量值(X)与算术平均数的离差平方和为最小值。
计算公式:
H m1 m2 ...mn
m1 m2 ... mn
x1
x2
xn
n
mi
i1
n mi
x i1 i
mi 表示第i个单位或第i组标志值对应的标志总量, 当各组标志总量相等,即m1=m2=…=mn= m时,即
n
mi
H i1
nm
n
n mi
x i1 i
n
m
1
x i1 i
n 1
x i1 i
例题见课本P44
CHENLI
14
3.1.2 众数 众数(mode)是数据中出现次数最多的那个观测值,也 就是是频数分布中频数或频率最大的数值,一般用M0 表示。 适用:分类数据、顺序数据以及数值型数据。
1.根据品质型和单项式分组数据计算众数
2.根据组距式分组数据计算众数
① 要确定众数所在组,即众数组。 ② 通过下面的下限公式或上限公式来计算众数。
CHENLI
3
3.1.1 平均数
平均数常用 x 来表示。是数据集中趋势的最主要测度值。
适用:数值型数据(不适用于分类数据和顺序数据)
算术平均数 常用形式:调和平均数 几何平均数
简单算术平均值 加权算术平均值 简单调和平均数 加权调和平均数 简单几何平均数 加权几何平均数
CHENLI
简单 平均数
解:由公式(3.1)
x
1 (67 78 49 56 98 87 62 20
100 73 45 70 44 96 80
49 61 60 88 93 60)分
70.8分
该班学生的数学平均成绩是70.8分。
CHENLI
6
2) 加权算术平均数
加权算术平均数:是通过各组标志值与各组频数相乘 的总和除以各组频数之和得到的。
第3章 统计数据的特征描述
3.1 集中趋势的描述 描述集中趋势的几个统计量及相互关系 3.2 离散程度的描述 描述离散程度的几个统计量 3.3 分布形态的描述 描述分布形态的几个统计量
CHENLI
1
数据的特征和测度
集中趋势
数值平均值
均值
位置代表值
众数 中位数
离散程度
分布的形状
方差和标准差
偏度
全距
峰度
适用:已经分组整理并编制出频数分布的数据资料。
计算公式为nxi fi Nhomakorabean
x i1 n
xi
fi
n
fi
i1
fi
i 1
i 1
式中,x i 是单项式分组形式下第i组的变量值或组距式
分组形式下第i组的组中值;f i是第i组的频数;n为
组数。
CHENLI
7
已整理的单项式分组数据平均数算例
表 3-1 职工家庭平均人口数的辅助计算表
例题见P46
CHENLI
12
平均值计算结果的说明
(1)根据原始数据和分组资料计算的结果一般不 会完全相等,根据分组数据只能得到近似结果。
(2)只有各组数据在组内呈对称或均匀分布时, 根据分组资料的计算结果才会与原始数据的计算 结果一致。
CHENLI
13
数值平均值 总结
特点: •最常用的测度值 •均值利用了全体数据 •易受数据中极端值的影响 •用于数值型数据,而不能用于分类数据和顺序数据
加权 平均数
4
1.算术平均数(mean)
1) 简单算术平均数
简单算术平均数就是全部数据的算术平均数。
适用:未经分组整理的原始数据资料。
计算公式:直接将各个数据相加,再除以数据个数。 其计算公式为
x
1 n
n i 1
xi
式中,x i 是一组样本数据的观测值,n为样本容量。
CHENLI
5
【例3.1】 某班级20名学生的期末数学成绩是67、 78、49、56、98、87、62、100、73、45、70、 44、96、80、49、61、60、88、93、60(分),求 该班学生的数学成绩的平均数。