当前位置:文档之家› 第四章 集中趋势测量法_社会统计学

第四章 集中趋势测量法_社会统计学


12
2. 对于分组资料
fX X PX f
注意:对求和符号,此时流动脚标的变动范围是1,2,3 … ,n, n是组数,而不是总体单位数。
很显然,算术平均数不仅受各变量值(X)大小的影 响,而且受各组单位数(频数)的影响。由于对于总体的影 响要由频数( f )大小所决定,所以 f 也被称为权数。值得 注意的是,在统计计算中,权数不仅用来衡量总体中各标 志值在总体中作用,同时反映了指标的结构,所以它有两 种表现形式:绝对数(频数)和相对数(频率)。这样一 来,在统计学中,凡对应于分组资料的计算式,都被称为 加权式。
17
1. 对未分组资料
(1)、先把所有数据按大小顺序排 列,如果总体单位数为奇数,则取 第(N+1)/2 位上的变量值为中位 数; (2)、如果总体单位数为偶数。 因为居中的数值不存在,按惯例, 取第 N/2位和第(N+1)/2 位上的 两个变量值的平均作为中位数。
18

例 求54,65,78,66,43这些数字的中位 数。 例、求54,65,78,66,43,38 这些数字的 中位数。
fX X f
间距
148―152 152―156 156―160 160―164 164―168 168―172 172―176 176―180 180―184 184―188 188―192 192―196
合计
频数(f)
1 2 5 10 19 25 17 12 5 3 0 1
100
组中值(X)
150 154 158 162 166 170 174 178 182 186 190 194
——
15
3. 算术平均数的性质
各变量值与算术平均数的离差之和等于0。 各变量值对算术平均数的平方和,小于它们对任 何他数偏差的平方和 算术平均数受抽样变动影响较小。 受极端值影响较大。
分组资料如遇有开放组距时,不经特殊处理 不能进行算术平均数的计算。
16
第二节 中位数按大小 顺序排列,位于正中处的变量值,即为中位数, 用Md表示。 Md可用于定序、定距、定比资料。
合计
50
1.00
31
求下表中的众数
32
3. 众数的性质
(1) 众数仅受上下相邻两组频数大小的影响,不受极 端值影响,对开口组仍可计算众数; (2) 受抽样变动影响大; (3) 众数不唯一确定。 (4) 众数标示为其峰值所对应的变量值,能很容易区 分出单峰、多峰。因而具有明显偏态集中趋势的频数分 布,用众数最合适。
48
49


在上述计算平均价格的过程中,早、中、 晚三个时段购买蔬菜所花费的现金是计算 平均价格的权数,这种方法我们称为加权 调和平均法。 由以上分析过程得出调和平均数的定义:
调和平均数是各个变量值倒数的算术平均 数的倒数,习惯上用(H)表示。
50
51
3. 各种平均数的关系
(1) 当总体呈正态分布时: (2)当总体呈偏态分布时:中位数总在均数和众数之间 正偏: 负偏: (注: 和 合称位置平均数) (3) 皮尔逊发现 ,在钟形分布的偏态不大显著时, 、
13
[例] 求下表(单项数列)所示数据的算术平 均数 。
人口数(X)
2 3 4 5 6 7 8
户数(f)
5 8 16 10 6 4 1
频率(P)
0.10 0.16 0.32 0.20 0.12 0.08 0.02
合计
50
1.00
14
对于组距数列,要用每一组的组中值权充该 组统一的变量值。 [例] 求下表所示数据的的算术平均数
你会吗?

19
2. 对于分组资料 (1)单项数列
根据N/2在累计频数分布中找到中位数所在组, 该组变量值就是Md 。
中 位 数
20
(2)组距数列
当根据组距数列求中位数时,要采用所谓的比 例插值法:先根据N/2在累计频数分布中找到中位 数所在组,然后假定该组中各变量值是均匀分布的, 再用以下任何一种方法求出中位数(注意:此处用 的是向上累计)。 按中位数所在组的下限:
25
请从下表中指出第一四分位数和第三四分 位数
26
求出下表中的第一四分位数和第三四分数
27
第三节 众数(Mode)
众数是在一组资料中,出现次数(或频 数)呈现出“峰”值的那些变量值,用Mo表示。 众数只与次数有关,可以用于定类、定序、 定距、定比资料。
28
1. 对于未分组资料 直接观察 首先,将所有数据顺序排列;然后,只要 观察到某些变量值(与相邻变量值相比较)出现 的次数(或频数)呈现“峰”值,这些变量值就 是 众数。
8


萨姆:每周100元又是怎么回事呢? 吉斯莫:那称为众数,是大多数人挣 的工资。 吉斯莫:老弟,你的问题是出在你不 懂平均数、中位数和众数之间的区别。 萨姆:好,现在我可懂了。我……我 辞职!
9
第一节 算术平均数(MEAN)
用总体标志总量除以总体单位数即得 算术平均数(Arithematic mean)。
33
第四节 几何平均数、调和平均数(了解)
1. 几何平均数Mg (geometric mean )
N个变量值连乘积的N次方根。(不能有变量值为
0)。适用于:(1) 计算某种比率的平均数;(2) 计算大 致具有几何级数关系的一组数字的平均数,如经济指标 的平均发展速度。 (1)简单几何平均数
对数式:
29
2. 对于分组资料
单项式:观察频数分布 (或频率分布 )
组距式:
Lo为众数组下限; Δ1为众数组频数与前一组频数之差; Δ2为众数组频数与后一组频数之差; ho为众数组组距。
30
求下表中的众数
人口数(X) 众 数
2 3 4 5 6 7 8
户数(f)
5 8 16 10 6 4 1
频率(P)
0.10 0.16 0.32 0.20 0.12 0.08 0.02
11
1. 对于未分组资料
X X N
注意:对求和符号,此时流动脚标的变动范围是1, 2, 3, … ,N ,
N是总体单位数。
[例] 求74、85、69、9l、87、74、69这些数字的 算术平均数。 [解]
X X = N
74 85 69 91 87 74 69 =78.4 7
萨姆;你欺骗我!我已经找其他工人核 对过了,没有一个人的工资超过每周100 元。平均工资怎么可能是一周300元呢? 吉斯莫:啊,萨姆,不要激动。平均工 资是300元。我要向你证明这一点。
7



吉斯莫:这是我每周付出的酬金。我得 2400元,我弟弟得1000元,我的六个亲 戚每人得250元,五个领工每人得200元, 10个工人每人100元。总共是每周6900元, 付给23个人,对吧? 萨姆:对,对,对!你是对的,平均工 资是每周300元。可你还是蒙骗了我。 吉斯莫;我不同意!你实在是不明白。 我已经把工资列了个表,并告诉了你, 工资的中位数是200元,可这不是平均工 资,而是中等工资。
我们有三种方法选择集中趋势: (1)根据频数:哪个变量值出现次数越 多,就选择哪个变量值,比如民主决策的表决 机制。 (2)根据居中:比如一个城镇居民的生活 水平,居中的是小康家庭,那么就用小康家庭 来代表该城镇的生活水平。 (3)根据平均:用平均数来代表变量的 平均水平。
5
关于集中趋势的一个故事
43
44
45

第三种买法:早、中、晚各买一元
在这种情况下,计算蔬菜平均价格比上述 两种方法稍微复杂一些,我们得先计算出 一元钱所购买蔬菜的数量,然后再计算蔬 菜的平均价格。 要计算蔬菜的平均价格,首先应该计算出 早、中、晚各花费1元钱所购买蔬菜的数量:

46
47

这种计算平均指标的方法同算术平均法有 很大的不同,由于资料中缺乏总体单位总 量,所以,就不可能直接用算术平均的方 法计算平均指标。为了达到计算目的,首 先要用变量值的倒数计算出总体单位总量 来,然后再计算平均指标,调和平均数法 因此而得名,也正是由于这个原因,调和 平均数又称为倒数平均数。
37
38

[例] 某地区GDP 1991~1995年平均发展速度 为107.2%,1996~1998年平均发展速度为 108.7%,1999~2000年平均发展速度为110%, 求该地区1991~2000年间的平均发展速度。
39
40
2. 调和平均数Mh ( harmonic mean)
N个变量值倒数算术平均数的倒数, 也称倒数平均数。适用于:掌握的情况 是总体标志总量而缺少总体单位数的资 料时。
24
4. 四分位数
中位数所有单位被等分为两部分,因而被称为二分 位数。类似于求中位数,我们还可求出四分位数、十分 位数、百分位数。 将总体中的各单位分割成相等的四部分,则这三个 分割的变量值就是四分位数。若以Q1、Q2、Q3分别代表 第一、第二、第三四分位数。Q2 即中位数,Q1、Q3的算 法分别是

三者大致构成一个比较固定的关系:
(4) 、 和 合称数值平均数
52
53
54
55
第四章 集中趋势测量法
算术平均数
主 要 内 容
中位数 众数 几何平均数和调和平均数
1

统计分析首先要解决的问题,就是寻求 一个简单数值以代表搜集所得的资料。 平均指标就是表明同质总体在一定条件 下某一数量标志所达到的一般水平。 平均指标把总体各单位之间的差异加以 抽象概括,其中个别标志值的偶然性被 相互抵消,从而反映出总体分布的集中 趋势。


吉斯莫先生有一个小工厂,生产超级小 玩意儿。 管理人员由吉斯莫先生、他的弟弟、六 个亲戚组成。工作人员由5个领工和10个 工人组成。工厂经营得很顺利,现在需 要一个新工人。 现在吉斯莫先生正在接见萨姆,谈工作 问题。
相关主题