当前位置:
文档之家› 1统计学-数据的描述性分析解析
1统计学-数据的描述性分析解析
70 - 80
80 - 90 90-100 100-110 110以上
50
36 27 14 8
表格 (元)
2.00 2.40 3.00 4.00 合计
销售数量 (千克)
20 60 140 80 300
众数M0=3.00(元)
② 根据组距数列确定众数
(ⅰ) 由最多次数来确定众数所在组;
(ⅱ)利用比例插值法推算众数的近似值。
例
按日产量分组(千克) 60以下 60 - 70
工人人数 (人) 10 19
Xh
m =m X
在社会经济统计学中经常用到的仅是一种特定 权数的加权调和平均数。即有以下数学关系式成立:
X Xf f Xf 1 X Xf m m X Xh
m 式中:m Xf ,f X
m是一种特定权数,它不是各组变量值出现的次 数,而是各组标志值总量。
下三图无众数:
说明:如果所有数据出现的次数都一样,那么这组数据没 有众数.
适用范围
众数主要用于分类数据,也可用于顺序数据和数值型数据, 对于未分组数据和单项式分组数据,众数位置确定之后便 找到了众数.
例:分类数据的众数
例:顺序数据的众数
数值型数据众数的计算方法
① 根据单项数列确定众数; 例
某种商品的价格情况
4
99% 95% 92% 90%=93.94%.
△ 几何平均数的特点 如果数列中有一个标志值等于零或负值, 就无法计算 X ;
G
受极端值的影响较
X
和
X h 小;
它适用于反映特定现象的平均水平,即 现象的总标志值是各单位标志值的连乘积。
注:(1)
(2) 数值平均数主要适用于定量数据,而不适用于定性数据. (3) 简单数值平均数适用于未分组的资料,加权数值平均数 适用于分组的资料.
●
(1).各变量值与均值的离差之和等于零.
x
n i =1
n i
i
x =0
(2).各变量值与均值的离差平方和最小.
x
i =1
x = min
2
△ 算术平均数的特点
算术平均数适合用代数方法运算,因此运用 比较广泛; 易受极端变量值的影响,使 X 的代表性变小; 受极大值的影响大于受极小值的影响; 当组距数列为开口组时,由于组中值不易确 定,使 X 的代表性也不很可靠;同时要求各单位 标志值在组内是均匀分布的,此时各组的平均数正好 等于它的组中值。故用组中值计算得出来的平均数只 能是一个近似值。
(1)简单几何平均数
G x1 x2 xn xi
n
1 n
式中G表示几何平均数, xi表示各项标志值.
(2)加权几何平均数
G
fi
i 1
n
x x x
f1 1 f2 2 fn n
fi
i 1
n
xi
fi
例 某企业四个车间流水作业生产某产品, 一车间产品合 格率99%,二车间为95%,三车间为92%,四车间为90%, 计算该企业的平均产品合格率.
x
x f
i 1 i
n
i
f
i 1
n
f xi
i 1
n
nf
x
i 1
n
i
n
i
例:计算某车间工人加工零件平均数(组距式数列)
解:
x f X f
i i i
i i
2640 66 个 40
关于计算结果的说明 根据原始数据和分组资料计算的结果一般不会完全相等, 根据分组数据只能得到近似结果. ●只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.
总体均值常用X 或 表示,样本均值常用 x 表示,样本均值 的计算公式: 简单算术平均数:
x1 x2 xn x n n
x
x
i 1
n
i
加权算术平均数:
x
i 1 n
n
i
fi
i
f
权数的意义和作用
• 权数:各组次数(频数)的大小所对应的标志值对平均数 的影响具有权衡轻重的作用. • 当各组的次数都相同时,即当 f1 =f 2 =f3 = =f n 时: 加权算术平均数就等于简单算术平均数.
位置平均数
1.众数(Mode) 一组数据中出现次数最多的变量值. 主要特点: ●不受极端值的影响. ●有的数据无众数或有多个众数.
① 只有总体单位数比较多,而且又有明显的集中趋势时才 存在众数。
M0
M0
M0
若有两个次数相等的众数,则称复众数。
M0
M0
② 在单位数很少,或单位数虽多但无明显集 中趋势时,计算众数是没有意义的。
本章内容
第一节 集中趋势的描述
第二节 离散程度的描述 第三节 分布的偏态与峰度
集中趋势
集中趋势反映的是一组数据向某一中心值 靠拢的倾向,在中心附近的数据数目较多, 而远离中心的较少。对集中趋势进行描述就 是寻找数据一般水平的中心值或代表值。
众数 位置平均数 中位数 平均数 算术平均数 数值平均数 调和平均数 几何平均数
△ 调和平均数的特点 如果数列中有一标志值等于零,则无法 计算 X h ;
X h 受极端值的影响要小。 较之算术平均数,
例.某蔬菜批发市场三种蔬菜日成交数据如下表,计算三 种蔬菜该日的平均批发价格.
3.几何平均数(Geometric Mean),又称“对数平均数” 是另一种形式的平均数,是n个标志值乘积的 n 次方根.主 要用于计算平均比率和平均速度.
2、调和平均数(又称“倒数平均数”)
调和平均数是各个变量值倒数的 算术平均数的倒数。
其计算方法如下:
1 (1).先计算各个变量值的倒数,即 X
1 X (2).计算上述各个变量值倒数的算术平均数,即 n
(3).再计算这种算术平均数的的倒数,就是调和平均数, 即
Xh n
n
1 X
1 X
在加权的情况下:
1.数值平均数:是以统计数列的所有数据来计算的平 均数.其特点是统计数列中任何一项数据的变动,都会 在一定程度上影响数值平均数的计算结果. 2.位置平均数:它不是对统计数列中所有数据进行计 算所得的结果,而是根据数列中处于特殊位置上的个 别单位或部分单位的标志值来确定的.
一、 数值平均数
数值平均数包括算术平均数、调和平均数和几何平均数. 1.算术平均数(均值, Arithmetic Mean)