当前位置:文档之家› 第四章 统计学 数据的概括性度量

第四章 统计学 数据的概括性度量

一、概念 指应用对比的方法来反映相 关事物之间数量联系程度的 指标,也称为相对数。
二、作用 •使不能直接对比的现象找到共同的比 较基础; •用来进行宏观经济管理和评价经济活 动的状况。
三、相对指标的基本表现形式 有名数 用双重计量单位表示的复名数 无名数 用倍数、系数、成数、﹪、‰等表示 分母 为1 分母为 1.00 分母 为10 分母 为100 分母为 1000




统计学认为,数据的分布特征,可以从三个方面 进行测度和描述: 一是数据的分布中心在哪里?越靠近中心数据越 密集,我们把这种特征称谓集中趋势,中心值可 以代表数据的一般水平; 二是一般数据偏离其中心程度有多大?我们把数 据分布偏远离其中心值的程度称谓离中趋势,离 散值可以代表数据的变异程度; 三是分布的偏态和峰度,她们也反映数据分布形 状的差异。
5 42
原始数据: 25
分类数据的众数 (例题分析)
不同品牌饮料的频数分布 饮料品牌 频数 比例 百分比 (%)
解:这里的变量为“
饮料品牌”,这是个 分类变量,不同类型 的饮料就是变量值 所 调 查 的 50 人 中 , 购买碳酸饮料的人数 最 多 , 为 15 人 , 占 总 被调查人数的 30% ,因 此众数为“可口可乐 ”这一品牌,即
本章教学重点与难点
重点
1.集中趋势、离散程度的各测度值的特点 2.集中趋势、离散程度的应用场合,计算方法
难点
利用Excel计算数据的描述统计量并进行分析
统计分析方法概述 (补充内容)
统计分析方法一般根据统计数据的维 度,可以分为单变量数据分析方法、 双变量数据分析方法和多变量变量数 据分析方法。另外,截面数据和时序 数据的分析方法也有所不同。根据以 上综述,可将统计分析方法分为如下 几种类型:
集中趋势(central tendency)
1. 一组数据向其中心值靠拢的倾向和程度
2. 测度集中趋势就是寻找数据水平的代表值或中心值
3. 不同类型的数据用不同的集中趋势测度值
4. 低层次数据的测度值适用于高层次的测量数据,但 高层次数据的测度值并不适用于低层次的测量数据
分类数据:众数
众数(mode)
说 明
⒈为无名数; ⒉同一总体各组的结构相对数之和为1; ⒊用来分析现象总体的内部构成状况。
2、比例相对数
比例 总体中某一部分数值 100 ﹪ 相对数 总体中另一部分数值
例:我国某年国民收入使用额为19715亿元,其中 消费额为12945亿元,积累额为6770亿元。则
积累额与消费额 6770 17 100 ﹪ 1 : 2或 51.52 ﹪ 12945 33 的比率
(2)有名数 的强度相对数
为用双重计量单位表示的复名数, 反映的是一种依存性的比例关系或 协调关系,可用来反映经济效益、 经济实力、现象的密集程度等。
例:某地区某年末现有总人口为100万人,医院 床位总数为24700张。则该地区
每千人口拥有 24700 张 24.7张 千人 (正指标) 千人 的医院床位数 1000
果汁 矿泉水 绿茶 其他 碳酸饮料 合计
6 10 11 8 15 50
0.12 0.20 0.22 0.16 0.30 1
12 20 22 16 30 100
Mo=碳酸饮料
顺序数据的众数 (例题分析)
甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户) 百分比 (%)
解:这里的数据为顺 序数据。变量为“回 答类别” 甲城市中对住房 表示不满意的户数最 多 , 为 108 户 , 因 此 众数为“不满意”这 一类别,即
1、按反映的基本内容不同 总体单位总数 总体所包含的总体单位的数

总体各单位某一数量标志 总体标志总量 的标志值总和
注意:一个总体中只有一个单位总数,但可 以有多个标志总量,它们由总体单位的数量 标志值汇总而来。
2、按反映的时间状况不同
时期指标
表明现象总体在一段时期内发展过 程的总量,如在某一段时期内的出
甲公司商品销售额 5.4 1.5 是乙公司的倍数 3.6
说 明 ⒈为无名数,一般用倍数、百分数表示; ⒉用来说明现象发展的不均衡程度。
4、动态相对数(纵向对比)
是同类指标数值在不同时间 动态相对数 上的对比
动态 某指标报告期数值 100 ﹪ 相对数 该指标基期数值
说 明
⒈为无名数;
(四)双变量数据的因果关系分析方法(回归分 析,第十一章) 1.数值型数据的回归分析 2.数值型数据和属性数据的回归分析

(五)单变量时间序列数据的分析方法(第13章) 1.时间序列的描述性分析 2.时间序列的平稳性分析 3.平稳性序列的预测 4.有趋势序列的预测 5.复合型序列的分析
数据分布的特征
集中趋势 (位置) 离中趋势 (分散程度) 偏态和峰态 (形状)
数据分布特征的测度
数据特征的测度
集中趋势
众 数 中位数 平均数
离散程度
异众比率
分布的形状
偏 态
四分位差 方差和标准差 离散系数
峰 态
补充:指标的类型
总量指标
反映现象在一定时间、地点、 一、概念 条件下的总体规模或水平的 综合指标,即数量指标,也 称为绝对数。
t1时段
t2时段
t3时段
四、总量指标的计量单位 自然单位 如:台、件 大 差 实物单位 度量衡单位 如:米、平方米 适 综 如:标准吨 标准实物单位 用 合
范 围 能 力 小 强
劳动单位 如:工日、工时 价值单位 如:元
多个单位的结合运用:
复合单位 双重单位 多重单位
(如:人· 次、吨· 公里) (如:人/平方公里)
1. 一组数据中出现次数最多的变量值
2. 适合于数据量较多时使用 3. 不受极端值的影响 4. 一组数据可能没有众数或有几个众数 5. 主要用于分类数据,也可用于顺序数据和 数值型数据
众数(不惟一性)
无众数
原始数据: 10
一个众数
5
9
12
6
8
原始数据: 6
多于一个众数
5 8
9 28
8 36
5 42
生人数、死亡人数
具有可加性、数值大小与时期长短有 直接关系、需要连续登记汇总 时点指标 表明现象总体在某一时刻(瞬间) 的数量状况,如在某一时点的总
人口数
不具有可加性、数值大小与时期长短没 有直接关系、由一次性登记调查得到
关于一个人口总体的总量指标
时 出生人数 期 指 死亡人数 标 时 人口总数 点 指 t 标
⒉用来反映现象的数量在时间上的变动程度。
5、强度相对数
某一总量指标数值 的总量指标数值 相对数 另一有联系而性质不同
(1)无名数 的强度相对数
强度
一般用﹪、‰表示。
例:某年某地区年平均人口数为100万人,在该 年度内出生的人口数为8600人。则该地区
8600 1000 ‰ 8.6‰ 6 出生率 110 人口
计划完成程度 相对数
1、结构相对数
结构 总体部分数值 100 ﹪ 相对数 总体全部数值
例:我国某年国民收入使用额为19715亿元,其中 消费额为12945亿元,积累额为6770亿元。则
消费额占国民收入 12945 100 ﹪ 65.7﹪ 19715 使用额的比率 积累额占国民收入 6770 100 ﹪ 34.3 ﹪ 19715 使用额的比率
例3:己知某厂2000年的计划规定产品成本比上年降 低5%,实际降低6﹪。则
计划完成 1 6 ﹪ 100 ﹪ 98.95 ﹪ 即实际比计划单位 1 5 ﹪ 程度 成本下降了1.05%.
4.1
4.1.1 4.1.2 4.1.3 4.1.4
集中趋势的度量
分类数据:众数 顺序数据:中位数和分位数 数值型数据:平均数 众数、中位数和平均数的比较
每所医院床位 1 106 40.5人 张 负担的人口数 24700
(逆指标)
强度:人均GDP、人均粮食产量、资金利润率 密度:人口密度、商业网点密度、医疗网密度 普遍程度:电话普及率(2005年全国电话普及 率57部/百人)、私人汽车普及率
注意:强度相对数虽有“平均”的含 义,但它不是同质总体的标志总量与 总体单位数之比,所以不是平均数。
6、计划完成程度相对数
正指标:≥1,完成或超额完 成计划;
逆指标:≤1,完成或超额完 成计划;
计划完成程度 实际完成数 100 ﹪ 计划任务数 相对数
A.计划任务数表现为绝对数(平均数)时 直接应用上述公式:
例1:己知某厂2000年的计划产品产量为10万吨,实 际产量为12万吨。则:
计划完成 12 100 ﹪ 120 ﹪ 10 程度
非常不满意 不满意 一般 满意 非常满意
合计
24 108 93 45 30
300
8 36 31 15 10
100.0
Mo=不满意
数值型数据的众数 (例题分析)
例 某种商品的价格情况
价格 (元) 销售数量 (千克) 2.00 20 2.40 60 3.00 140 4.00 80 300 合计
第 4 章
4.1 4.2 4.3
数据的概括性度量
集中趋势的度量 离散程度的度量 偏态与峰态的度量
学习目标
1.集中趋势各测度值的计算方法 2.集中趋势各测度值的特点及应用场合 3.离散程度各测度值的计算方法 4.离散程度各测度值的特点及应用场合 5.偏态与峰态的测度方法 6.用Excel计算描述统计量并进行分析
(六)双变量时间序列数据的相关和回归方法 1.平稳序列的的相关和回归 2.非平稳序列的的相关和回归
(七)统计指数分析方法(第14章) (八)多变量数据分析方法 1.判别分析 2.因子分析 3.聚类分析
相关主题