当前位置:文档之家› 统计学数据分布特征描述

统计学数据分布特征描述


数据分布特征与测度:概览
集中趋势 (位置)
离中趋势 (分散程度) 偏态和峰态
(形状)
数据分布特征测度
集中趋势
幂平均数 中位数 众数
离散程度
分布形状
极差 平均差 方差、标准差 异众比率 变异系数
偏度 峰度
第一节 统计变量集中趋势测定
一 集中趋势指标及作用 二 数值平均数 三 众数与中位数(位置平均数)
Mp
k
N
xik
i 1
N
特例情况 幂平均数
算术平均数(幂指数 k=1) 调和平均数(幂指数 k=-1) 几何平均数(幂指数 k0) 其他幂平均数
k=1:算术平均数
➢ 加权
➢ 简单
N
xiwi
x
i 1 N
wi
i 1
N
xi x i1
N
k=-1:调和平均数
➢ 加权 ➢ 简单
N
MH
N
i 1
1
几种常见的位置特征数
数据分布的位置特征数实际上也是数据的代表值, 代表了数据的一般水平。
在不同场合,可以适当选用平均数、中位数、众数充 当位置特征数(代表值)
其中平均数不同于中位数、众数的特点在于: ➢平均数是由所研究的全体数据参加计算所得。
平均数的一般形式叫做幂平均数。常见的有算 术平均数、几何平均数、调和平均数。
一、集中趋势指标及作用
集中趋势(Central tendency)
➢集中趋势 即一组数据向其中心值聚集或靠
拢的倾向和程度。 用平均指标表示,代表数据的一
般水平。 ➢测定集中趋势是认识数据分布特征的
基本内容。
集中趋势指标有两类:
➢数值平均数 根据全部数据计算得到的代表值。
优点:数学性质良好,可用于统计推断 缺点:易受极端值影响。
➢如用平均工资了解职工工资分布的中心, 反映职工工资的一般水平。
2.比较同一现象在不同空间或不同阶段的发 展水平,反映现象变化特征、趋势和规律性。 ➢能消除总体规模差异造成的不利影响; ➢在一定程度上减弱偶然因素的影响。
3.分析现象之间的依存关系。 ➢如研究劳动者文化程度与收入的关系。
4.(数值)平均指标是推断统计中的重要 统计量,是进行统计推断的基础。
二、数值平均数
(一)幂平均数
➢ 幂,power
➢ 变量X取N个值: x1 , x2 , , xN。
➢ 权数为一组正数: w1 , w2 , , wN 。
➢ 加权幂平均数一般形式为: 其中,k 为任意实数。
N
xik wi
M
p
k
i 1 N
wi
i 1
➢权数w均相等时,加权平均数退化为简单 平均数:
➢是最常用的数值平均数;
➢根据掌握资料不同,其有多种计算公式。
1.简单算术平均数 ➢对未分组数据,采用简单算术平均数公式。即 把各项数据直接加总,然后除以总项数。 ➢计算公式:
N
xi x i1
N
举例
表 3-1 解:采用简单算术平均法计算,即全体队员的
男性 女性 平均年龄为(单位:周岁)
22 22
1 xi
wi
wi
i 1
N1
i1 xi
wi
N
wi
i 1
MH
1 N1
N N1
i1 xi i1 xi
N
k0:几何平均数 ➢加权
N
MG
wi
i 1
x1w1
x2w2

xNwN
➢简单
MG N x1 x2 xN
关于加权问题
权数确定方式: ➢客观权数: 权数由实际统计资料获得或推算。 ➢主观权数: 根据研究问题,由研究者主观赋值。
权数作用: ➢权衡变量的各种取值在计算平均数时的重 要性。 ➢权数作用,根本上是通过权数结构实现。
权数作用:
➢即使不改变被平均的数值,仅改变权数结构,即 可改变平均数水平。
例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
权数实质
➢权数的实质在于其结构,即结构比例形式(比重 权数)。
1 xi
wi
N
wi
i 1
N
MG
wi i1
x w1 1
x w2 2
x wN N
wi
N
N
wi
x i1 i
i 1
(二)算术平均数
➢算术平均数(Arithmetic mean ),也称均 值(mean)。
➢由一组数据的总和(总体标志总量)除以 该组数据的项数(总体单位总量)得到; 算术平均数=总体标志总量/总体单位总量
22 25 30 50 31.75 4
应采用加权平均。
50
1
合计
20
两种计算公式结果相同!
2.加权算术平均数
➢ 对单项式分组资料,应以各标志值出现次数为权数加权 平均 。
➢ 加权算术平均数计算公式:
n
x
x1 f1 x2 f2 ... xn fn f1 f2 ... fn
xi fi
i 1 n
fi
xf f
i 1
例3-1单项式分组资料(表3-2)计算方法为:
x 22 4 2510 30 5 501 4 10 5 1
主要有算术平均数、调和平均数及几 何平均数,三者均为幂平均数特例。
➢位置平均数 根据对总体中处于特定位置的单个或部
分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。
一、集中趋势指标及作用
集中趋势指标作用 1.反映变量分布的集中趋势和一般水平。
22
22
25
25
25
25
25 25 25 25
25 25
30 30 30 30
50 30
22 22 25 25 25 25 25 30 30 50 22 ... 30
20
538 26.9 20
表 3-2
年龄 人数(人)
x
f
22
4
25
10
30
5
分组数据不能简单平 均 !因为各组变量值 的次数(权数)不等! 若采用简单平均:
本章学习任务
以数值特征,对统计数据分布进行量化描述。 主要包括三方面:
➢集中趋势 用平均指标描述(位置特征);
➢离中趋势 用变异指标描述(离散特征);
➢偏斜程度 用偏度和峰度描述(偏斜特征、峰度特征)。
学习要求:
理解测度统计数据集中趋势、离散程度的概念 、指标、相互关系;
掌握主要分析指标的计算方法和应用场合,并能 熟练进行相关计算分析。
➢其更能清晰表明权数之权衡轻重的作用。
权数形式有2种:
➢ 绝对数形式
Mp
➢ 结构比例形式
k
N
xik wi
i 1
N
wi
i 1
k
N
i 1
xik
wi
N
wi
i 1
x
N
xiwi
i 1 N
wi
i 1
N
i 1
xi
wi
N
wi
i 1
MH
1
N
i 1
1 xi
wi
N
wi
i 1
1
N
i 1
相关主题