第六章变异指标
10
对分组资料,不能确知最大值和最小值,求全距 用最大组的上限减去最小组的下限
组距
f
150~156
3
156~162
9
162~168
25
168~174
34
174~180
20
180~186
7
186~192
1
192~198
1
合计
100
运用上 述方法计 算左边数 列的全距
11
对于开口组: 最高组的上限=最高组的下限+邻组的组距 最低组的下限=最低组的上限-邻组的组距
N
5
=
X2 (
X )2
27151
365
2
10.06
N
N
5 5
X
(X X)
(X X )2
72
-1
1
81
8
64
86
13
169
69
-4
16
57
-16
256
365
标准差是方差的正平方根。 方差和标准差即克服平均差带有绝 对值的缺点,又保留其综合平均的优点。
23
一、总体方差和标准差
• 1. 对于未分组资科
(X X )2
N
XHale Waihona Puke (X )2NN
24
求72、81、86、69、57这些数字的标准差。
X X 365 73.0
N5
(X X )2 506 10.06
平均差是离差绝对值的算术平均数 (mean deviation)。
15
1.对于未分组资料 A ·D= X X
N
2.对于分组资料
A
·D=
f X
f
X
3.平均差的性质
在受抽样变动、极端值影响,处理不确定组
距方面均同于算术平均数;不适于代数运算,其 理论意义不易阐述。
16
[例1] 试分别以算术平均数为基准, 求85,69,69,74,87,91,74这 些数字的平均差。
Q • D Q3 Q1 2
求下组成绩的四分位差:
请大家
计算一下, 看能否算对
78 80 82 85 89 87 90 86 79 88 84 81
14
三、 平均差(Mean absolute deviation)
要测定变量值的离中趋势,尤其是要测 定各变量值相对于平均数的差异情况,一 个很自然的想法就是计算各变量值与算术 平均数的离差。
• 变异指标 用以反映总体各单位标志值的变
动范围或参差程度,与平均指标相对应,从 另一个侧面反映了总体的特征。
5
例如有A、B、C、D四组学生各5人的成 绩如下:
A组:60 ,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80
7
二、标志变异指标的作用
• 1.标志变异指标是评价平均数代表性的依据。 • 2.标志变异指标可用来反映社会经济活动过
程的均衡性和稳定性。标志变异指标值小, 说明社会经济活动过程的均衡性和稳定性 好,反之则差。 • 3.标志变异指标还是抽样调查中计算抽样误 差和抽样数目的依据。
8
第二节 极差、分位差、平均差和异众比率
19
• 1. 变异系数 绝对离势统计量与其算术平均数的比
率,用V表示。变异系数是最具有代表性的 相对离势。
20
• 全距系数
全距系数是众数据的 全距与其算术平均数之 比,其计算公式是
VR
R X
• 平均差系数
平均差系数是众数据 的平均差与其算术平均 数之比,其计算公式是
VAD
R X
21
2. 异众比率
所谓异众比率,是指非众数的频数与总体单位 数的比值,用V·R来表示
其中:fM o
V R V fMo N
为众数的频数;N
是总体单位数
异众比率能表明众数所不能代表的 那一部分变量值在总体中的比重。
22
第三节 方差和标准差(standard deviation)
方差是各变量值对其算术平均数的离 差平方的算术平均数。
第六章离中趋势—— 标志变异指标
1
学习目的:
理解标志变异指标的意义和作用;掌握 各种标志变异指标的性质和计算方法。
2
•主要内容: •第一节:变异指标的意义和作用 •第二节:极差、分位差、平均差和异众比率 •第三节:方差和标准差 •第四节:偏度与峰度
3
第一节 变异指标的意义和作用
一、标志变异的概念 • 标志变异指标也称标志变动度,是反映总体各单
x 78.4
• X X =7.9 N
17
[例2] 试以算术平均数为基准,求下表所示数据 的平均差。
组距
f
150~156
3
156~162
9
162~168
25
168~174
34
174~180
20
180~186
7
186~192
1
192~198
1
合计
100
计算左 边数列的 平均差
18
四、异众比率
上述各种反映离中趋势的变异指标,都 具有和原资料相同的计算单位,称绝对离 势。但欲比较具有不同单位的资料的参差 程度,或比较单位虽相同而均值不相同的 资料的参差程度,离势的绝对指标则很可 能导致某些错误结论。所以,我们还得了 解和学习相对离势。
12
极差优缺点:
优点:
计算简单、 直观。
缺点:
(1)受极端值影响大; (2) 没有量度中间各个单位间 的差异性,数据利用率 低,信息丧
失严重;
(3)受抽样变动影响大,大样 本全距比小样本全距大。
13
二、四分位差(Quartile deviation) 第三四分位数和第一四分位数的半距。
避免全距受极端值影响大的缺点。
一、极差(Range)
极差(R):最大值和最小值之差。 也叫全距。全距越大,表示变动越大。
R =Xmax– Xmin
9
[例] 求74,84,69,91,87,74,69这些 数字
的全距。 [解] 把数字按顺序重新排列:69,69,
74, 74,84,87,91,显然有
R =Xmax– Xmin =91—69=22
数据显示:平均数相同,离势可能不同; 平均数不同,离势可能相同。
6
变异指标如按数量关系来分有以下两类; • 凡用绝对数来表达的变异指标,统称绝对离势;
主要有极差、平均差、四分位差、 标准差等。
• 凡用相对数来表达的变异指标,统称相对离势; 主要有异众比率、标准差系数、平均差 系数和一些常用的偏态系数。
位标志值之间差异程度的综合指标。 • 平均指标把总体各单位数量标志值间的差异抽象
化了,反映现象的一般水平,表明事物的集中趋 势。但被抽象化了的各单位标志值之间的差异究 竟有多大,平均指标的代表性又如何,这需要计 算标志变异指标来测定。
4
• 所谓离中趋势,是指数列中各变量值之间 的差距和离散程度。
• 离势小,平均数的代表性高; • 离势大,平均数代表性低。