集中趋势度量法
4.1 集中趋势的基本概念和作用 4.2 集中趋势的度量 4.3 算术平均值、中位数和众数的比较 4.4 集中趋势分析需注意的问题
西北工业大学管理学院
1. 集中趋势的基本概念 2. 集中趋势各测度值的计算方法 3. 集中趋势各测度值的特点及应用场合
西北工业大学管理学院
集中趋势 (位置)
离中趋势 (分散程度)
数据
西北工业大学管理学院
无众数
原始数据: 8 一个众数
原始数据:
10 5 9 12 6 659855
多于一个众数 原始数据: 25 28 28 36 42 42
西北工业大学管理学院
不同品牌饮料的频数分布
饮料品牌
频数 比例 百分比 (%)
可口可乐
15 0.30 30
旭日升冰茶 11 0.22 22
百事可乐
9 0.18 18
汇源果汁
6 0.12 12
露露
9 0.18 18
合计
50
1
100
解:这里的变量为“饮 料品牌”,这是个分类 变量,不同类型的饮料 就是变量值
所调查的50人中,购 买可口可乐的人数最多, 为15人,占总被调查人 数的30%,因此众数为 “可口可乐”这一品牌, 即
Mo=可口可乐
西北工业大学管理学院
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的测度值适用于高层次的测量数据,但高
层次数据的测度值并不适用于低层次的测量数据
西北工业大学管理学院
4.2 集中趋势的度量
4.2.1 分类数据:众数 4.2.2 顺序数据:中位数和分位数 4.2.3 数值型数据:平均数 4.2.4 众数、中位数和平均数的比较
西北工业大学管理学院
下限公式 : M e L
f
2
Sm1 i L(
f me
f
i
2 Sm1) fme
700 1500 720 100 774.3 1050
偏态和峰态 (形状)
西北工业大学管理学院
数据特征的测度
集中趋势
众数 中位数 平均数
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰态
西北工业大学管理学院
4.1 集中趋势的基本概念和 作用
4.1.1 基本概念 4.1.2 作用
西北工业大学管理学院
西北工业大学管理学院
表明同类现象在一定时间、地点条件下,所 达到的一般水平与大量单位的综合数量特征,有 以下3个特点:
中位数 1080
78
西北工业大学管理学院
【例】:10个家庭的人均月收入数据
排 序: 660 750 780 850 960 1080 1250 1500 1630 2000
位 置:
9 10
12 3 4 5 6
位置 n 1 10 1 5.5
2
2
78
中位数 960 1080 1020 2
西北工业大学管理学院
西北工业大学管理学院
1. 排序后处于中间位置上的值
50%
Me
2. 不受极端值的影响
50%
3. 主要用于顺序数据,也可用数值型数据,但不能 用于分类数据
4. 各变量值与中位数的离差绝对值之和最小,即 n xi M e min i1 西北工业大学管理学院
原始数据: 中位数位置 n 1 2
300
—
Me=一般
西北工业大学管理学院
【例】
原始数据: 1630
排 序: 2000
位 置:
9
9个家庭的人均月收入数据
1500 750 780 1080 850 960 2000 1250
750 780 850 960 1080 1250 1500 1630
1 2 3 4 5 6
位置 n 1 9 1 5 22
Mo=不满意
西北工业大学管理学院
计算公式
1)下限公式
M0
L
1 1 2
i
700
570 570 450
100
755.9
M
:众值
0
L :众值组的下限
1:众值组次数与下一组次数之差ຫໍສະໝຸດ :众值组次数与上一组次数之差
2
i:众值组的组距
西北工业大学管理学院
计算公式
2)上限公式
西北工业大学管理学院
4.2 集中趋势的度量
众数
位置均值
中位数
平均指标
分位数
计算均值
算术平均值 调和均值 几何均值
西北工业大学管理学院
西北工业大学管理学院
mo
1. 一组数据中出现次数最多的变量值 2. 适合于数据量较多时使用 3. 不受极端值的影响 4. 一组数据可能没有众数或有几个众数 5. 主要用于分类数据,也可用于顺序数据和数值型
西北工业大学管理学院
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市 户数 (户) 百分比 (%)
非常不满意
24
8
不满意
108
36
一般
93
31
满意
45
15
非常满意
30
10
合计
300
100.0
解:这里的数据为顺 序数据。变量为“回 答类别”
甲城市中对住房 表示不满意的户数最 多 , 为 108 户 , 因 此 众数为“不满意”这 一类别,即
M0
u
1 1 2
i
800
450 570 450
100
755.9
M
:众值
0
u:众值组的上限
1:众值组次数与下一组次数之差
:众值组次数与上一组次数之差
2
i:众值组的组距
西北工业大学管理学院
优点:不受变量数列极端数值的影响,不受变量数列 中开口组的影响。
缺点:要求总体单位数足够多、且具有明显的集中 趋势。
顺序数据: 中位数位置 n 2
西北工业大学管理学院
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市 户数 (户) 累计频数
解:中位数的位置为 300/2=150
非常不满意
24
不满意
108
一般
93
满意
45
非常满意
30
合计
300
24
从累计频数看,
132
中位数在“一般”这
225
一组别中
270
中位数为
1. 用一个代表数值综合反映个体某种标志值的一 般水平。
2. 将个体标志值之间的差异抽象掉了。
3. 计量单位与标志值的计量单位一致。
西北工业大学管理学院
西北工业大学管理学院
• 比较若干总体的某种标志数值的平均水平 • 研究总体某种标志数值的平均水平在时间上的变化 • 分析社会经济现象的依存关系 • 研究和评价事物优劣的数量指标 • 计算和估算其他重要的经济指标