统计学-数据的描述性分析
1
n n1
xn
x i1 i
(2) 加权调和平均数
n
H m1 m2 m3 mn m1 m2 m3 mn
mi
i 1
n mi
x1 x2 x3
xn
i1 xi
式中,m表示各单位或各组的标志值对应的标志总量.
例.某蔬菜批发市场三种蔬菜日成交数据如下表,计算三 种蔬菜该日的平均批发价格.
正偏
(2) 皮尔逊经验法则 分布在轻微偏斜的情况下,众数、中位数和算术平均 数数量关系的经验公式为:
xM o3(xM e)
众数、中位数、平均数的特点和应用
1. 众数
– 不受极端值影响 – 具有不惟一性 – 数据分布偏斜程度较大且有明显峰值时应用
2. 中位数
– 不受极端值影响 – 数据分布偏斜程度较大时应用
统计学-数据的描述性分析
本章内容
第一节 集中趋势的描述 第二节 离散程度的描述 第三节 分布的偏态与峰度
集中趋势
集中趋势反映的是一组数据向某一中心值 靠拢的倾向,在中心附近的数据数目较多, 而远离中心的较少。对集中趋势进行描述就 是寻找数据一般水平的中心值或代表值。
位
置
平
均
数
众数 中 位 数
8
80-90
4
90分以上
1
案例3:丙班《统计学》考试情况如下表:
60分以下
2
60-70
5
70-80
12
80-90
25
90分以上
7
问题
1、计算甲、乙、丙三个班的平均成绩;该平均值是真 实值还是近似值?如是近似值,什么情况下会是真实值?
2、计算甲、乙、丙三个班的中位数、众数;
3、如要选择从算术平均数、中位数和众数三个平均数 中选择一个数来分别代表甲、乙、丙三个班的整体水平, 请问你会选择哪个平均数?为什么?
③.几何平均数(Geometric Mean)
是另一种形式的平均数,是n个标志值乘积的 n 次方根.主 要用于计算平均比率和平均速度.
(1)简单几何平均数
Gnx1x2
1
xn xin
式中G表示几何平均数, x i 表示各项标志值.
n
可以看作均值的一种变形lgG1(
n
lgxi lxg1lgx2 lgxn)i1n
平
均
数
算术平均数
数值平均数 调和平均数
几 何 平 均 数
1.数值平均数:是以统计数列的所有数据来计算的平 均数.其特点是统计数列中任何一项数据的变动,都会 在一定程度上影响数值平均数的计算结果. 2.位置平均数:它不是对统计数列中所有数据进行计 算所得的结果,而是根据数列中处于特殊位置上的个 别单位或部分单位的标志值来确定的.
3.1.1 数值平均数
数值平均数包括算术平均数、调和平均数和几何平均数.
①.算术平均数(均值, Arithmetic Mean)
总体均值常用X 或 表示,样本均值常用 x 表示,样本均值
的计算公式:
简单算术平均数:
xx1 x2
xn
n
xi
i1
nn
n
加权算术平均数:
x
xi fi
i1 n
fi
权数的意义和作用
• 权数:各组次数(频数)的大小所对应的标志值对平均数
的影响具有权衡轻重的作用.
• 当各组的次数都相同时,即当f1=f2=f3= =fn 时:
加权算术平均数就等于简单算术平均数.
n
n
n
xi fi f xi
xi
x
i1 n
fi
i1
nf
i1 n
i1
例:计算某车间工人加工零件平均数(组距式数列)
计算该企业的平均产品合格率.
4 9 9 % 9 5 % 9 2 % 9 0 % = 9 3 .9 4 % .
练习:某管理局所属的15个企业,2000年按其生产某产品 平均单位成本的高低分组资料如下,试计算平均单位成本.
中国工商银行的某笔投资的年利率是按照复利计算的,25 年利率分配(按时间数列):有一年是3%,有4年是4%,有8年 是8%,有10年为10%,有2年为15%.求平均年利率.
3. 平均数
– 易受极端值影响 – 数学性质优良 – 数据对称分布或接近对称分布时应用
数值平均数与位置平均数的适用场合?
案例1:甲班《统计学》考试情况如下表:
60分以下
2
60-70
8
70-80
22
80-90
10
90分以上
4
案例2:乙班《统计学》考试情况如下表:
60分以下
2
60-70
30
70-80
xi x =0
i =1
(2).各变量值与均值的离差平方和最小.
n
2
xi x 数, Harmonic Mean)
调和平均数分为简单调和平均数和加权调和平均数. (1)简单调和平均数 标志值的倒数的算术平均数的倒数.
H
1
11
x1 x2
n
n
1 11
xn x1 x2
注:(1)
(2) 数值平均数主要适用于定量数据,而不适用于定性数据. (3) 简单数值平均数适用于未分组的资料,加权数值平均数 适用于分组的资料.
3.1.2 位置平均数
①.众数(Mode)
一组数据中出现次数最多的变量值.
主要特点: ●不受极端值的影响. ●有的数据无众数或有多个众数.
说明:如果所有数据出现的次数都一样,那么这组数据没 有众数.
适用范围
众数主要用于分类数据,也可用于顺序数据和数值型数据, 对于未分组数据和单项式分组数据,众数位置确定之后便 找到了众数.
例:分类数据的众数
例:顺序数据的众数
②.中位数(Median)
中位数是一组数据按一定顺序排列后,处于中间位置 上的变量
负偏 注: (1)中位数总是介于众数和平均数之间.
4、如要分别反映甲、乙、丙三个班的考试情况,你会 选择用哪些指标来衡量?
(2)加权几何平均数
n
n
G i1fi x1f1x2f2
xnfn
fi
i1
fi
xi
例3.1.1 一位投资者持有一种股票,1997,1998,1999,2000年 收益率分别为4.5% ,2.0% ,3.5% ,5.4% .计算该投资者在这四 年内的平均收益率.
例3.1.2 某企业四个车间流水作业生产某产品, 一车间产 品合格率99%,二车间为95%,三车间为92%,四车间为90%,
解: X i xi fi 264066个 fi 40
i
关于计算结果的说明
●根据原始数据和分组资料计算的结果一般不会完全相等, 根据分组数据只能得到近似结果.
●只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.
(1).各变量值与均值的离差之和等于零.
n