当前位置:
文档之家› 【统计学】 第三章数据分布特征的测度
【统计学】 第三章数据分布特征的测度
原来只是计 算时使用了 不同的数据
!
6. 计算公式为
HM
X i Fi X i Fi Xi
X i Fi Fi
调和平均数
(算例)
【例】某蔬菜批发市场三种蔬菜的日成交数据如表3-3,计 算三种蔬菜该日的平均批发价格
蔬菜 名称
甲 乙 丙
合计
表3-3 某日三种蔬菜的批发成交数据
批发价格(元) Xi
第三章 数据分布特征的测度
所谓“钻研”, 就是要在金属上占有一席之地,
让石头开一个缝…… ——与大家共勉
本章内容
第一节 集中趋势的测度 第二节 离散程度的测度 第三节 偏态与峰度的测度
学习目标
1.集中趋势各测度值的计算方法 2.集中趋势不同测度值的特点和应用场合 3.离散程度各测度值的计算方法 4.离散程度不同测度值的特点和应用场合 5.偏态与峰度测度方法 6.用SPSS计算统计量并进行分析
1. 各变量值与均值的离差之和等于零
n
(Xi X) 0
i 1
2. 各变量值与均值的离差平方和最小
n
(Xi X )2 min
i1
调和平均数(Harmonic mean)
(概念要点)
1. 集中趋势的测度值之一
2. 均值的另一种表现形式——倒数平均数
3. 易受极端值的影响 4. 用于定比数据 5. 不能用于定类数据和定序数据
工人人数(人) f
比重权数 (f/∑f)
15
10
0.07
16
20
0.13
17
30
0.20
18
50
0.33
19
40
0.27
合计
150
1.00
解:
X Xf 1510 16 20 1730 1850 19 40 2640 17.6 17
f
150
150
加权均值
(权数对均值的影响)
甲乙两组各有10名学生,他们的考试成绩及其分布数据如下
5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定
数据特征分布的和测度 (本节位置)
数据的特征和测度
集中趋势
众数 中位数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰度
一、定距和定比数据:均值 (Mean)
均值
(概念要点)
1. 集中趋势的测度值之一 2. 最常用的测度值 3. 一组数据的均衡点所在 4. 易受极端值的影响 5. 用于数值型数据,不能用于定类数据和
(概念要点)
1. 集中趋势的测度值之一 2. N 个变量值乘积的 N 次方根 3. 适用于特殊的数据 4. 主要用于计算平均发展速度 5. 计算公式为
N
GM N X 1 X 2 X N N X i
i 1
6. 可看作是均值的一种变形
log GM
1 N
(log
X1
log
X2
log
合计
—
50
K
X
X i Fi
i 1
6160 123.( 2 个)
K
Fi
50
i 1
XiFi
322.5 562.5 940.0 1715.0 1275.0 795.0 550.0
6160.0
例 某企业工人按日产量分组资料如下所示,根 据资料计算工人的平均日产量。
表3-2 某企业工人日产量分布
日产量(件) X
X i Fi
i 1 K
Fi
i 1
简单均值
(算例)
原始数据:10 5 9 13 6 8
N
X i1 X i X1 X 2 X 3 X 4 X 5 X 6
N
6
10 5 9 13 6 8 6
8.5
加权均值
(算例)
【例】根据表3-1中的数据,计算50 名工人日加工零件数的均值
定序数据
均值
(计算公式)
设一组数据为:X1 ,X2 ,… ,XN
简单均值的计算公式为
N
X
X1 X2 XN
Xi
i 1
N
N
设分组后的数据为:X1 ,X2 ,… ,XK
相应的频数为: F1 , F2,… ,FK
加权均值的计算公式为
K
X
X 1F1 X 2 F2 X N FN F1 F2 FN
表3-1 某车间50名工人日加工零件均值计算表
按零件数分组
105~110 110~115 115~120 120~125 125~130 130~135 135~140
组中值(Xi)
107.5 112.5 117.5 122.5 127.5 132.5 137.5
频数(Fi)
3 5 8 14 10 6 4
成交额(元) XiFi
成交量(公斤) Fi
1.20
18000
15000
0.50
12500
25000
0.80
6400
8000
—
36900
48000
H M
X i Fi 36900 0.76( 9 元) X i Fi 48000 Xi
三种蔬菜的平均价格为0.769元
几何平均数(Geometric mean)
甲组: 考试成绩(X ): 0 20 100
人数分布(F ):1 1 8
乙组: 考试成绩(X ): 0 20 100
人数分布(F ):8 1 1
X甲
i=1 Xi n
0×1+20×1+100×8
10
82(分)
X乙
i=1 Xi n
0×8+20×1+100×1
10
12(分)
均值
(数学性质)
集中趋势
(Central tendency)
1. 一组数据向其中心值靠拢的倾向程度
2. 测度集中趋势就是寻找数据一般水平的代表值或中心值
3. 不同类型的数据用不同的集中趋势测度值
4. 低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势测度值并不适用于低层次 的测量数据
103.84%
平均收益率=103.84%-1=3.84%
XN)
N
log
i 1
N
Xi
几何平均数
(算例)
【例】一位投资者持有一种股票,2003年、2004 年、2005年和2006年收益率分别为4.5%、2.0%、 3.5%、5.4%。计算该投资者在这四年内的平均收 益率。
GM N X1 X 2 X N
4 104.5% 102.0% 103.5% 105.4%
数据分布的特征
集中趋势 (位置)
离中趋势 (分散程度) 偏态和峰度 (形状)
数据分布的特征和测度
数据的特征和测度
集中趋势
众数 中位数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰度
第一节 集中趋势的测度
一. 定距和定比数据:均值 二. 定类数据:众数 三. 定序数据:中位数和分位数 四. 众数、中位数和均值的比较