数据分布特征的描述
K
x
xi fi
i 1 K
fi
3060 76.5 40
i 1
权数(fi ,也称权重)
权数——指在计算总体平均数或综合水平的过程中对各个 数据起着权衡轻重作用的变量。
可以是绝对数形式,也可以是比重形式(如频率)表示。
x x f f
事实上比重权数更能够直接表明权数权衡轻重作用的实质
当权数完全相等(f1 =f2 =…= fn)时,加权算术平均数就
1、结构相对指标 计算各组总量占总体或样本总量的比重,用以
反映总体或样本结构状况的综合指标。
结构相对数
各组总量 总体(样本)总量
100 %
1、结构相对指标
①可以反映总体内部结构的特征。 ②通过不同时期相对数的变动,可以看 出事物的变化过程及其发展趋势。 ③结构相对数一般用百分数表示。 ④各组结构相对数之和等于100%或1。
算术平均数
变量值总和 变量值个数
注:平均指标和强度相对数的区别 分子和分母在经济内容上有从属关系,即分子数值是各 分母单位特征的总和,两者在总体范围上是一致的。
(一)简单算术平均数
把每项数据直接加总后除以它们的项数 通常用于对未分组的数据计算算术平均数 计算公式:
n
x
x1 x2 ... xn
相对数。相对数由两个互相联系的数值对比 求得。常用的相对数包括:结构相对数、动 态相对数、比较相对数、强度相对数、利用 程度相对数、计划完成相对数等。
平均数。平均数反映现象总体的一般水平或 分布的集中趋势。
第一节 总量指标和相对指标
一、总量指标 (一)总量指标的概念和作用 总量指标是反映现象在具体时间、地点、 条件下的总规模或总水平的统计指标。 总量指标也称为绝对指标或绝对数。
动态相对数
报告期水平 基期水平
100 %
正确运用相对指标的原则
1、注意两个对比指标的可比性 2、相对指标要和总量指标结合起来运用 结合运用的方法有两种: 一是计算分子与分母的绝对差额; 二是计算每增长1%的绝对值。
增长量=报告期水平-基期水平
增长量
基期水平
增长1%绝对值 (发展速度 1)100 100
比较相对指标
甲地某指标数值/乙地同一指标数值
计划完成程度指标 实际数/计划数
强度相对指标
某一指标数值/同期另一有联系的指标数值
动态相对指标
报告期水平/基期水平
数据分布的特征描述
数据分布的特征:
一、集中趋势:反映数据向其中心靠拢或聚集程度; 二、离散趋势;数据远离中心的趋势; 三、偏态和峰态;偏态是对数据分布对称性的度量;
强度相对数的两种表示方法: (1)一般用无名数表示。 (2)少数用百分数或千分数表示。 注:强度相对数不是平均数,不是同类指标数值 之比。
强度相对数
某一总量指标数值 另一有联系而性质不同 的总量指标数值
例:
表现社会服务能力的强度相对数是用服务单位数与人口比较。 表现现象普遍成都的强度相对数,如人口密度、公路网密度等。
第二节 平均指标
1.概念 也称平均指标或平均数 用来反映标志值的典型水平或标志值分布 的中心位置或集中趋势
2.作用 反映变量分布的集中趋势和一般水平。 可用来比较同一总体在不同空间的发展水平 可用来分析现象之间的依存关系 是统计推断中一个重要的统计量。
集中趋势
(central tendency)
相对指标的表现形式:有名数、无名数。 有名数是将对比的分子指标和分母指标的计量单位 结合起来使用。 无名数是一种抽象化的数值,一般分为系数、倍数、 成数、百分数、千分数等。
(二)相对指标的种类和计算方法
相对指标通常分为:结构相对指标、比例相对指 标、比较相对指标、计划完成相对指标、强度相对指 标和动态相对指标。
成了简单算术平均数。
变量数列的权数有两种形式: 一种是以绝对数表示,称次数或频数;
另一种是以比重表示,称频率。
X
X
•
f
f
用频率计算的公式和直接用次数计算的公式在内 容上是相等的,即
Xf f
X
•f
(三)算术平均数的数学性质
1、各个变量值与算术平均数的离差之和等于零。
(X X) 0 (X X )f 0
加权—为了体现各变量值轻重不同的影响作用,
对各个变量值赋予不尽相同的权数(fi ).
[例]
表 某班级40名同学统计学原始成绩(单位:分)
简单算术平均数算式:
X 64 70 78 75 3089 77.23
40
40
表 40名同学统计学成绩汇总表(单位:分)
加权算术平均数算式:
55×2+65×8+75×16+85×10 +95×4=3060
比较相对数可以是两个总量指标对比,也可 以是相对指标或平均指标对比。
比较相对数
某条件下的某类指标数 值 另一条件下的同类指标 数值
100 %
4、计划完成相对数
是用一定时期内实际完成指标与计划指标的 比重,来反映计划完成程度的综合指标。
计划完成相对数
实际完成数 计划数
100 %
计划完成相对数
实际完成百分比 计划完成百分比
例:我国2001-2007年若干统计指标资料
指标
2001年 2002年 2003年 2004年 2005年 2006年 2007年
国内生产总值 (亿元)
年末总人口数 (万人)
109655 120333 135823 159878 183218 211924 249530 127627 128453 129227 129988 130756 131448 132129
总量指标在社会经济统计中的作用:
①可以反映社会经济和企业的基本情况,反 映一个国家的基本国情和国力,
②它是计算相对指标、平均指标等描述指标 的基础。
③是制定政策、编制计划、实行社会经济管 理的基本依据。
(二)总量指标的种类
1、总量指标按其反映的时间状况不同,分为时期 指标和时点指标。
•时期指标反映现象在某一时期发展过程的总数量; •时点指标则反映现象在某一时刻上的状况总量。
二、调和平均数
1.集中趋势的测度值之一; 2.算术平均数的另一种表现 形式; 3.易受极端值的影响; 4.有简单调和平均数和加权 调和平均数。
原来只是计算 时使用了倒数
二、调和平均数
调和平均数又称“倒数平均数”,它是各个变 量值倒数的算术平均数的倒数。
n
Xh
1 X
简单调和平均数和加权调和平均数
Xh
峰度是指数据分布的平峰或尖峰程度(形状)。
数据分布的特征
集中趋势(平均指标) (位置)
离散趋势(变异指标) (分散程度)
偏态和峰度 (形状)
数据分布的特征和测度
数据的特征和测度
集中趋势
众数 中位数 均数
离散程度 分布的形状
离散系数
方差和标准差
四分位差
偏态 峰度
第二节 平均指标
数据分布集中程度的描述指标
xi
i 1
x
n
n
n
x Xi代表变量, 代表算数平均数, n变量值个数,∑求和
表 3-1 男性 女性 22 22 22 22 25 25 25 25 25 25 25 25 25 25 30 30 30 30 50 30
解:采用简单算术平均法计算,即全体队员 的平均年龄为(单位:周岁):
22 22 25 25 25 25 25 30 30 50 22 ... 30
人均国内生产总 值(元)
8622
9398
10542 12336 14053 16165 18934
第三产业占国内 生产总值比重%
40.5
41.5
41.2
40.4
40.1
40.0
40.1
相对指标的种类和计算方法
相对指标
计算方法
结构相对指标
总体中部分数值/全部数值
比例相对指标
总体中A部分数值/B部分数值
第四章 数据分布特征的描述
描述数据分布特征的指标主要有三大类:
一是描述数据分布集中趋势的指标; 二是描述数据分布离散程度的指标; 三是描述分布偏斜程度的指标。
统计指标的分类
总量指标(绝对数)—数量指标 相对指标(相对数)—质量指标 平均指标(平均数)—质量指标
绝对数。现象的规模、水平一般以绝对数形 式表现。
人均产量
某一主要工业品或农产品的全国产量 全国人口数(一般按年初年末人口平均数计算)
商业网点密度
某地零售商业机构数(正指标) 某地人口数(千人)
某地人口数(千人)(逆指标) 某地零售商业机构数
6、动态相对指标
概念:是不同时期同一指标数值之比,用以 反映现象在不同时期发展变化程度的综合指标。 动态相对数的计算结果用百分数或倍数表示。
例:我国规模以上工业增加值的轻重工业构成表
轻重工业
2006年 工业增加值/亿元
比重%
2007年 工业增加值/亿元
比重%
轻工业
24314
30.49
28277
29.90
重工业
55438
69.51
66304
70.10
合计
79752
100.00
94581
100.00
2、比例相对指标
比例相对数是总体或样本中不同部分加以 对比,用以反映总体或样本内部的比例关系和 协调关系的综合指标。
2、各个变量值与算术平均数的离差平方之和等于最小值。
( X X )2 最小值 ( X X )2 f 最小值
算术平均数有两点不足:
1、算术平均数易受极端变量值的影响, 使 X的代表性变小,而且受极大值的影响 大于受极小值的影响。