当前位置:文档之家› 第二章 统计数据的收集整理与显示6

第二章 统计数据的收集整理与显示6


2.2.4.3 频率分布
累计分布有向上累计分布与向下累计分布两种。 向上累计分布是将各组的频数或频率由变量值小的组向变 量值大的组累计,累计结果分别说明各组上限以下的累计频 数或累计频率的分布状况。当累计到最后一组时,其累计频 数或累计频率等于总频数或100%。 向下累计分布是将各组的频数或频率由变量值大的组向变 量值小的组累计,累计结果分别说明各组下限以上的累计频 数或累计频率的分布状况。当累计到最后一组时,其累计频 数或累计频率等于总频数或100%。
表2-4 某年年底某高校在职教师年龄累计分布数列
比重 教师按年 人数 龄分组 (人) (%) 向上累计 向下累计
频数(人)频率(%) 频数(人)频率(%)
30岁以下 30~40岁 40~50岁 50~60岁 60岁以上
合计
201 317 366 151 15
1050
19.14 30.19 34.86 14.38 1.43
100.00
201 518 884 1035 1050

19.14 49.33 84.19 98.57 100.00

1050 849 532 166 15

100.00 80.86 50.67 15.81 1.43

2.3
数据的显示
2.3.1 统计表 2.3.2 统计图
统计表
将统计数据按一定的顺序排列在表格上,就形成了 统计表。从广义讲,统计表包括统计工作各阶段所使用 的一切表格,有调查表、汇总表和分析表。本章将侧重 就表现统计整理结果所用的统计表进行讨论。 统计表的构成 1.从统计表的形式上看,可由总标题、横行标题、 纵栏标题和指标数值四部分组成。 此外有些统计表在 表下还增列补充资料、注解、附记、资料来源、某些指 标的计算方法、填表单位、填表人员以及填表日期等。
组距式变量数列又可分为:等距式数列与不等距式数列;开 口式数列与封闭式数列等
年龄 (岁) 0-10 10-20 20-30 30-40 40-50 50-60 合计
人数 比重(%) f/∑f f 3 5 4 4 2 2 20 等距数列 15 25 20 20 10 10 100
年龄 (岁) 0-10 10-30 30-50 50-60 合计
2.2.4.3 频率分布
1.频率分布的性质
按顺序列出各组的组别及相应的频率,就构成频率分布。 频率分布可以比频数分布更好地体现出总体分布特征。频率 分布有两个基本性质:一是各组频率都是一个介于0与1之间 的分数,即大于0而小于1;二是各组频率之和等于1。
2.累计频率分布
在频数分布的基础上,将各组频数依次累计,就形成 累计频数分布。各组累计频数与总频数之比,就形成累计频 率分布。
例如:
3)组中值的计算
3)组中值的计算
在编制组距数列时,为了避免出现空白组,同时又能使个别 变量离差较大的单位不致于无组可归,往往在首末两组使用 “××以下”及“××以上”的不确定组限的形式。这种形 式叫做“开口组”。
为进行统计分析,有时也要假定开口组的组限,并计算 其组中值。
一般可按相邻组的组距来计算“开口组”的假定的组限.然 后再计算组中值。计算式为,
统计表的构成
表2-5 2005年我国三次产业增加值及增长情况表 总标题 比2004年增长
异距数列
不连续组距数列
2.2.4.3变量数列的编制
1.单项数列的编制 2.组距数列的编制
根据总体各单位的变量值进行同类合 并,并列出相应的单位数或比重。
1)确定变量数列的形式——根据变量的性质及特点选择不同的变量数列。
2) 确定组距和组数 —— 注意几个概念:上限、下限、组距、组数。
组数过多,组距太小,要避免将相同性质的单位分到不同组中去; 反之,如果组数过少,组距太大,要避免将不同性质的单位分到同一 组中去。 3) 确定组限 ——(1 )客观数量界限。(2 )第一组的下限和最后一组 的上限。有极端值时,第一组和最后一组可采用开口组。(3)尽可能 采用5或10的倍数。 “上限不在内原则” 4) 确定分配次数 —— 可利用EXCEL表进行汇总。
人数 比重(%) f/∑f f 3 15 9 45 6 30 2 10 20 100
异距数列
2.2.4.2分布数列的种类
由于分组是分布数列的基础,因此有怎样的分组就形成怎样 的次数分布。 综合上述各种的分组,分布数列的类型,可归纳为:
品质数列
分布 数列
变量数列
单项数列 等距数列 组距数列 连续组距数列
男生
文科
本科
女生 男生 女生 男生
专科
理科
本科
女生
男生
专科
女生
3.按品质标志分组
按品质标志分组,就是选择反映事物属性差异的品 质标志作为分组标志,并在品质标志的变异范围内 划定各组界限,将总体划分成为若干个性质不同的 组成部分。
例如:人口总体按性别,分为男、女两组; 再如:企业总体按所有制,分为全民、集体、合 营、个体等组。
统计年鉴中按年 龄分组为:
0-14 15-64
少年 中青年
65岁以上 老年
2)组限的确定
当组距、组数确定后,只需划定各组数量界限便可 编制组距数列。
3)组中值的计算
组距数列掩盖了分布在组内各单位的实际变量值。 为了反映各组中个体单位变量值的一般水平,统计 工作中往往用组中值来代表它。 组中值是组内变量范围的中间数值,通常可根据备 组的上限、下限进行简单平均,即: 组中值=(上限+下限)/2
对总体只按一个标志进行分组,称为简单分组。 如:以产值作为划分企业规模的标志;按文化程 度对人口总体进行分组。
统计对总体往往要从多方面进行研究,仅仅依赖 一个分组标志进行分组是难以满足需要的,必须 运用多个分组标志进行多种分组,形成一个分组 体系,才能满足需要。
2.复合分组
对同一总体选择两个或两个以上的标志层叠进行分 组,就形成复合分组。 例如,为了认识我国高等院校在校学生的基本状况, 可以同时选择学科、学制、性别等三个标志进行复 合分组,得到如下分组体系。
如用相对数形式表示便是比率。比率是一种结构相 对数,各组比率之和应等于1或100%。
各组次数或比率的大小意味着相应的变量值在决定 总体数量表现中所起的作用不同。次数或比率大的 组,其变量值在决定总体数量表现中的作用就大, 反之就小。 由于社会经济现象性质的不同,各种统计总 体都有不同的次数分布,形成各种不同类型的分布 特征。
首组假定下限=首组上限-邻组组距………………(4)
组中值=上限-邻组组距/2
末组假定上限=末组下限+邻组组距………………(5) 组中值=下限+邻组组距/2
按成绩分组X组中值 Nhomakorabea60分以下 60-70分 70-80分 80-90分
90分以上
55
65 75
85
95
4)分布数列的次数
次数是分布在各组中的个体单位数。
10~15年 15~20年 20年以上 数量标志分组
统计分组的作用
1 、提示类型:统计分组的根本作用是将复杂的社会经济现象 按照统计认识的要求区分为各个性质不同的组成部分。 2.说明总体现象的内部结构。现象的内部结构是表明现象本 质特点的一个重要方面,将同一总体不同时期的结构联系起来, 还可以看到现象的发展趋势和规律。 3、反映变化。将总体的分组资料按时间的移动联系起来进行分 析,可以反映总体及各组在数量上的变动情况和变动规律。 4、分析总体现象之间的依存关系。通过分组将有相互影响的现 象联系起来进行研究,反映它们在数量上的变动规律。例如:商 品销售额与流通费用率的关系;居民收入与储蓄额的关系。
品质数 列
2.2.4.2分布数列的种类
由于分组是分布数列的基础,因此有怎样的分组就形成怎样 的次数分布。 综合上述各种的分组,分布数列的类型,可归纳为:
品质数列
分布 数列
变量数列
单项数列
组距数列
某组人群20个人年龄如下(单位:岁):
1,5,12,15,21,12,15,21,21,22,30,33,15,30,5,48,49,
4.按数量标志分组
按数量标志分组,就是选择反映事物数量差异的数 量标志为分组标志,并在数量标志的变异范围内划 定各组界限,将总体划分为性质不同的若干组成部 分。 例如,居民家庭按子女数分组,可分为0人 (无子女)、1人、2人、3人;等等。
例 1 为了了解某地区银行存款的构成,可以选用 存款性质、期限两个标志分别进行分组: 按存款性质分组 存款同时按其性质及期限分组 企业存款 企业存款 简单 储蓄存款 分组 活期 财政性存款 定期 按存款期限分组 品 储蓄存款 质 活期存款 活期 复合 标 定期存款 志 分组 定期 分 财政性存款 组 例2 企业职工按工龄分组: 活期 5年以下 定期 5~10年
1)确定组距和组数
单项数列不存在组距的问题
编制组距数列时,不仅要考虑各组的划分是否能区分总体内 各组成部分的性质差别,还需要确定适当的组距和组数,才 能准确而清晰地反映总体的分布特征。 在实际进行分组时,采用等距数列或异距数列,应决定于现 象的性质和研究的目的。标志值分布比较均匀时,一般用等 距数据;标志值分布很不均匀时,应采用异距数列 。
本科课程陈宜治系列课件
统计学
课件制作:陈宜治
2.2.3

统计分组
统计分组的含义 统计分组的种类

统计分组的 概念和原则
25%
33% 42%
概念 原则
根据统计研究的目的和客观现象的内在特点, 按某个标志(或几个标志)把被研究对象的总体 划分为若干个不同性质的组。
穷尽原则、互斥原则
文盲或识字不多 小学毕业 中学毕业(含中专) 大专毕业 大学及大学以上
例1:从业人员按文化程度分组 小学毕业 中学毕业(含中专) 大学毕业
相关主题