数据的概括性度量
层次数据的测度值并不适用于低层次的测量数据
众数
(mode)
一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和
数值型数据 应用范围不多
众数
(不惟一性)
无众数 原始数据: 4 3 7 10 5 9 12 6 8
2017年底港府统计处发表《2016年中期人口统计》, 称本港人均居住面积中位数为161呎(约合15平方米)
四分位数
(quartile)
排序后处于25%和75%位置上的值
25% 25% 25% 25%
QL
QM
QU
不受极端值的影响
四分位数
(位置的确定)
原始数据:
分组数据:
数值型数据的四分位数
(9个数据的算例)
合计
人数
3 7 13 5 2
30
向上累积
3 10 23 28 30
——
mefm
.i
100
30 / 2 10 10 13
103.85
美国人口普查局发布报告显示,2013年美国家庭年 收入的中位数是51939美元
四口之家的年收入在23624美元以下即为贫困户。
2016年,美国家庭收入中位数增长3.2%,从2015 年的57230美元增至59039美元,创有记录以来新 高,超过1999年的前纪录58655美元。所有数字都 是经过通胀调整后的。
位 置: 1 2 3 4 5 6 7 8 9
中位数 1080(元/月)
数值型数据的中位数
(9个数据的实例)
【例1】 10个家庭的人均月生活费支出数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 1680 排 序: 750 780 850 960 1080 1250 1500 1630 1680 2000
位 置: 1 2 3 4 5 6 7 8 9 10
中位数 (1080+1250)/2=1165(元/月)
分组数据的中位数的近似公式
me
l
n
/
2 fm
sm1
.i
在求中位数时,如果数据大量重复某一数值 ,这时的中位数未必准确,在解释时要特别 小心。
实例分析
按零件加工数分组
80-90 90-100 100-110 110-120 120-130
样本均值
k
x x1 f1 x2 f2 L xk fk i1xi fi
f1 f2 L fk
k
i1
fi
实例分析
按零件加工数分组
80-90 90-100 100-110 110-120 120-130
合计
人数
3 7 13 5 2
30
组中值
加权均值 (例题分析)
k
x
xi fi
i 1 k
fi
排 序: 660 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5 6 7 8 9 10
试想一下分组数据的四分数计算近似公 式
十分位数
有几个十分位数? 十分位数的位置如何确定 如何求十分位数?
百分位数
有几个百分位数? 百分位数的位置如何确定 如何求百分位数?
均值
(mean)
1. 集中趋势的最常用测度值 2. 一组数据的均衡点所在 3. 易受极端值的影响 4. 是客观事物必然性数量特征的一种反映
简单均值
(simple mean)
总体均值 样本均值
加权均值
(weighted mean)
设一组数据为: x1 ,x2 ,… ,xk 相应的频数为: f1 , f2 ,… ,fk
一个众数 原始数据: 5 5 6 5 9 8 5 5 5
多于一个众数 原始数据:28 25 28 28 28 36 42 42 42 42
原始数据(职业):
教师 医生 公务员 教师 医生 银行职员 财务人员 医 生 教师 教师
中位数
(median)
排序后处于中间位置上的值
50%
Me
不受极端值的影响
平均增长速度等方面有很重要的作用。
计算公式
G
n
x 1
x2
L
xn
适用于特殊数据,变量值x一般为比率
9.97%
某企业最近4年产品销售收入的年增长 率分别为8%、7%、12%、13%,求该企 业这4年销售收入的年平均增长率?
50%
主要用于顺序数据,也可用数值型数据,但不能用 于分类数据
各变量值与中位数的离差绝对值之和最小。
中位数的位置
未分组数据 中位数的位置=(1+n)/2
分组数据 中位数的近似位置=n/2
数值型数据的中位数
(9个数据的实例)
【例1】 9个家庭的人均月生活费支出数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000
第四章 统计数据的概括性度量
4.1 集中趋势的度量 4.2 离散程度的度量 4.3 偏态与峰态的度量
学习目标
• 掌握集中趋势各测度值的计算方法和 应用场合
• 掌握离散程度各测度值的计算方法及 应用场合
• 了解偏态和峰态的测度方法 • 能运用EXCEL计算描述统计量并进行分
析
4.1 集中趋势的度量
85 3 95 7 105 13 115 5 125 2 30
i 1
3110 103.67 30
均值
(数学性质)
各变量值与均值的离差之和等于零
n
xi x 0
i 1
各变量值与均值的离差平方和最小
n
( xi x )2 m in i 1
几何平均数
是n个变量值乘积的n次方根,用G表示 在计算社会经济问题的平均发展速度和
【例1】:9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630
排 序: 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5 6 7 8 9
【例2】:10个家庭的人均月收入数据
4.1.1 众数 4.1.2 中位数和分位数 4.1.3 平均数 4.1.4 众数、中位数和平均数的比较
集中趋势
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的测度值适用于高层次的测量数据,但高