关于常用统计量数课件
算术平均数
:可简称为平均数或均数,是用以度量次数 分布集中趋势及位置最常用的集中量数。
(一)总体平均数与样本平均数
N
XX1X2•••XN i1Xi
N
N
(二)加权平均数
XX1F 1X2F 2•••XKFK F 1F 2•••FK
(三)算术平均数的性质
1.每一个观测值加上一个相同常数C,其平均数为原来的平 均数加常数C
中数的特点:计算简单,不受极端数据影响,但由于是根据 数据的相对位置来确定的,在计算时不是每个数据都加入, 从而有较大的抽样误差,不如平均数稳定,且会流失很多的 被试信息,同时,中数难以作进一步的代数运算
(二)众数
众数又称为范数,常用Mo表示。众数指次数 分布中出现次数最多的那个数的数值。 适用条件:当一组数据中出现不同质的情况, 或分布中出现极端数据时,常用众数作为集 中量数的粗略估计。 计算众数的皮尔逊经验法:
第一节 集中量数
一、算术平均数 二、几何平均数 三、中数与众数
集中量数
• 集中量数
– 对数据的集中趋势的度量 – 确定一组数据的代表值
常用的集中量数
算术平均数 mean 加权平均数 几何平均数geometric mean 中数median 众数mode
问题
某部门有5名一般职员和1名经理。一般职员的薪水 是3000元,而经理的薪水是10000元,请问该部门收 入的平均水平是多少?
Mo=3Mdn-2M
众数 Mode,Mo
众数:一组数据中出现次数最多的数 – 如2、3、5、3、4、3、6的众数为3
如果次数分布最多的有两个数,而且两个数是相邻的, 那么一般取两者的平均值作为众数;如果这两个数不 相邻,那么一般需要报告两个众数,而且认为该组数 据是bimodal双峰分布的
第二节 差异量数
与自由度(degrees of freedom) 有关。自由度是数学名词,在统计学 中,n个数据如不受任何条件的限制, 则n个数据可取任意值,称为有n个自 由度。若受到k个条件的限制,就只 有(n-k)个自由度了。计算样本方 差时, n个变量值本身有n个自由度。 但受到样本均数的限制,任何一个 “离均差”均可以用另外的(n-1) 个“离均差”表示,所以只有(n-1) 个独立的“离均差”,因此只有(n -1)个自由度。
8
B
18
75
7
C
16
70
8
D
20
70
6
∑
74
—
—
(四)标准差的性质
1.每一个观测值都加一个常数c后,计算得到 的标准差等于原标准差。 2.每一个观测值都乘以一个常数c,则所得的 标准差等于原标准差乘以这个常数。 3.每个观测值都乘以同一个常数c(c≠0), 再加上一个常数d,所得标准差等于原标准差 乘以这个常数c。
几何平均数
适用条件:
1.一组数据中任何两个相邻数据之比接近于常数, 即数据按一定比例关系变化。在教育与心理研究 中,求平均增长率或对心理物理学中的等距与等 比量表实验进行数据处理,均应使用几何平均数。
2.当一组数据中存在极端数据时,分布呈偏态, 算术平均数不能很好地反映数据的典型情况,此 时应使用几何平均数或其他集中量数(如中数、 众数)来反映数据的典型情况。
算术平均数的优点
反应灵敏,确定严密,简明易解,计算简便 并能作进一步的代数演算,是应用最普遍的 一种集中量数。
适用情境:数据准确可靠,且又同质,需要 每一个数据都能加入计算,同时还要作进一 步的代数运算时,一般都用算术平均数表示 集中趋势。
易受极端数据影响、出现模糊数据和存在不 同质数据时无法计算
关于常用统计量数
描述统计 (descriptive statistics)
描述统计
– 对数据特征进行描述
数据的两个主要特征
– 中心位置 – 离散性
Outline
第一节 集中量数 一、算术平均数 二、几何平均数 三、中数与众数
第二节 差异量数 一、平均差 二、方差与标准差 三、差异系数
第三节 地位量数 一、百分位分数 二、百分等级分数
(三)标准差的合成
方差具有可加性。在已知几个组方差或标准差的情 况下,可以计算她们的总方差或总标准差。-只有在 应用同一种观测手段,对不同样本的统一特质进行 测量时才能使用。
标准差的合成 ,
St
nS2 d2
n
:总平均数; :各小组的平均数i
练习
表 4 个学习小组的竞赛成绩
学习小组
n
X
S
A
20
80
(一)几何平均数的基本公式
(二)几何平均数在教育与心理研究中的应用
1.心理物理学中等距与等比量表实验的数据处 理 2.平均增长率的计算
(一)中数
中数又称中位数,符号记为Mdn。中数是指位于一组数列中 中间位置的那个数,它可以是数列中的某一个原始数据,也 可以不是原始数据而是通过计算得到的一个数。总之,如果 将一组数据按大小排列,则中数一定是将数据个数平均分为 大小相等两部分的那个数。
一、平均差 二、方差与标准差 三、差异系数
离中趋势的度量
数据离中趋势是表示数据分散程度的一 组统计量, 反映的是各变量值远离其中心值 的程度。表示数据离中趋势的测度有:平均 差、方差、标准差、四分位差、极差(全 距)、变异系数等。
一、平均差(Mean deviation)
1.定义:也称平均离差,次数分布中所有原始数
2.每一个观测值乘以一个相同常数C,其平均数为原来的平 均数乘常数C
3.每个观测值都乘以一个相同常数c,再加上一个常数d后,计 算得到的平均数等于原平均数乘以该常数c再加上常数d
4.观测值与平均数的差(离均差)的总和等于零
5.观测值与任意常数C的离差平方和不小于观测值与平均数 的差的平方和。-离差平方和最小,样板平均数是总体平均数 的最佳估计。
据与平均数举例的绝对值的平均,用AD表示。
2.计算公式
平均差的数学性质不是最优的,在实际应用中应用较少。
二、方差 与标准差 (Variance)
(Standard deviation )
方差与标准差事最经常用于描述次数分布 离散程度的差异量数。 (一)总体方差与总体标准差 (二)样本方差与样本标准差 (三)标准差的合成 (四)方差与标准差的意义
方差与标准差的定义
方差:每个数据与该组数据平均数之差乘方 后的均值,即离均差平方和的平均数。 标准差:方差的算术平方根,表示一列数据 的平均差距。Leabharlann (一)总体方差与总体标准差
总体方差的表示:
总体标准差的表示:
(二)样本方差与样本标准差
样本方差的表示: 样本标准差的表示:
样本方差为什么要除以(n-1)