当前位置:文档之家› 数据分布特征的测度

数据分布特征的测度

数 据 分 布 特 征 的 测 度
演讲人
2020-09-30
目 录
0 1 集中趋势 0 2 离散程度 0 3 分布的形状
01
集中趋势
出现次数最多的变量值
没有众数或两个以上众数
集中趋势
众数
不受极端值影响
用于分类数据、顺序数据、 数值型数据
排序后处于中间位置上的值 用于顺序数据、数值型数据
集中趋势
中位数
不受极端值影响
各变量值与中位数的离差绝 对值之和最小
均值
,一组数据的中心 位置,是集中趋势
的最常用测度
01
02
用于数据型数据, 不能用于分类数据
和顺序数据
03
容易受极端值的影 响
04
调和平均数
几何平均数
05
均值
调和平均数
均值的另一种表现形式 容易受极端值影响 计算公式
均值
几何平均数
n个变量值乘积的n次方根 适用于对比率数据的平均 主要用于计算平均增长率 计算公式
02
离散程度
异众比率
A
离散程度
四分位差
B
方差和标准差
C
离散系数
D
对分类数据离散程度 的测度
A
非众数组的频数占总 频数的比率
B
用于衡量众数的代表 性
C
计算公式为
D
离散程度
异众比率
异众比率
用于衡量众数的代 表性
非众数组的频数占 总频数的比率
对分类数据离散程 度的测度
C
B
A
计算公式为
D
反映中间50%数据的离散程 度
用于衡量中位数的代表性
离散程度
四分位差
不受极端值影响
四分位差
反映中间 50%数据的
离散程度
不受极端值 影响
用于衡量中 位数的代表

离散程度
方差和标准差
极差
平均差
方差和标准 差
方差和标准差
极差
01
一组数据的最 大值与最小值
之差
02
易受极端值影 响
03
04
未考虑数据分 布
计算公式
平均差
各变量值与其均值离差绝 对值的平均数
峰态
0 1
数据分布扁平
程度的测度
0 2
峰态系数=0扁
平峰度适中
0 3
峰态系数<0
为扁平分布
0 4
峰态系数>0
为尖峰分布
0 5
峰态系数
感 谢 聆 听
能全面反映一组数据的 离散程度
数学性质较差,实际中 应用较少
计算公式
分组数据 未分组数据
方差和标准差
离散程度的最常 用测度值
总体/样本方差 或标准差
反映各变量值与 均值的平均差异
方差和标准差
计算公式
对数据相对离散程度的测度 用于对不同组别数据离散程
度的比较
离散程度
离散系数
消除了数据水平高低和计量 单散程度的测 度
用于对不同组别数据离散 程度的比较
离散系数
消除了数据水平高低和计 量单位的影响
计算公式
03
分布的形状
分布的形状
偏态
峰态
分布的形状
偏态
数据分布 偏斜程度
的测度
偏态系数 =0为对 称分布
偏态系数 >0为 右偏分布
偏态系 数
偏态系数 <0为 左偏分布
分布的形状
相关主题