当前位置:
文档之家› 第二章 统计数据的收集整理与显示6
第二章 统计数据的收集整理与显示6
2.2.4.3 频率分布
累计分布有向上累计分布与向下累计分布两种。 向上累计分布是将各组的频数或频率由变量值小的组向变 量值大的组累计,累计结果分别说明各组上限以下的累计频 数或累计频率的分布状况。当累计到最后一组时,其累计频 数或累计频率等于总频数或100%。 向下累计分布是将各组的频数或频率由变量值大的组向变 量值小的组累计,累计结果分别说明各组下限以上的累计频 数或累计频率的分布状况。当累计到最后一组时,其累计频 数或累计频率等于总频数或100%。
表2-4 某年年底某高校在职教师年龄累计分布数列
比重 教师按年 人数 龄分组 (人) (%) 向上累计 向下累计
频数(人)频率(%) 频数(人)频率(%)
30岁以下 30~40岁 40~50岁 50~60岁 60岁以上
合计
201 317 366 151 15
1050
19.14 30.19 34.86 14.38 1.43
100.00
201 518 884 1035 1050
—
19.14 49.33 84.19 98.57 100.00
—
1050 849 532 166 15
—
100.00 80.86 50.67 15.81 1.43
—
2.3
数据的显示
2.3.1 统计表 2.3.2 统计图
统计表
将统计数据按一定的顺序排列在表格上,就形成了 统计表。从广义讲,统计表包括统计工作各阶段所使用 的一切表格,有调查表、汇总表和分析表。本章将侧重 就表现统计整理结果所用的统计表进行讨论。 统计表的构成 1.从统计表的形式上看,可由总标题、横行标题、 纵栏标题和指标数值四部分组成。 此外有些统计表在 表下还增列补充资料、注解、附记、资料来源、某些指 标的计算方法、填表单位、填表人员以及填表日期等。
组距式变量数列又可分为:等距式数列与不等距式数列;开 口式数列与封闭式数列等
年龄 (岁) 0-10 10-20 20-30 30-40 40-50 50-60 合计
人数 比重(%) f/∑f f 3 5 4 4 2 2 20 等距数列 15 25 20 20 10 10 100
年龄 (岁) 0-10 10-30 30-50 50-60 合计
2.2.4.3 频率分布
1.频率分布的性质
按顺序列出各组的组别及相应的频率,就构成频率分布。 频率分布可以比频数分布更好地体现出总体分布特征。频率 分布有两个基本性质:一是各组频率都是一个介于0与1之间 的分数,即大于0而小于1;二是各组频率之和等于1。
2.累计频率分布
在频数分布的基础上,将各组频数依次累计,就形成 累计频数分布。各组累计频数与总频数之比,就形成累计频 率分布。
例如:
3)组中值的计算
3)组中值的计算
在编制组距数列时,为了避免出现空白组,同时又能使个别 变量离差较大的单位不致于无组可归,往往在首末两组使用 “××以下”及“××以上”的不确定组限的形式。这种形 式叫做“开口组”。
为进行统计分析,有时也要假定开口组的组限,并计算 其组中值。
一般可按相邻组的组距来计算“开口组”的假定的组限.然 后再计算组中值。计算式为,
统计表的构成
表2-5 2005年我国三次产业增加值及增长情况表 总标题 比2004年增长
异距数列
不连续组距数列
2.2.4.3变量数列的编制
1.单项数列的编制 2.组距数列的编制
根据总体各单位的变量值进行同类合 并,并列出相应的单位数或比重。
1)确定变量数列的形式——根据变量的性质及特点选择不同的变量数列。
2) 确定组距和组数 —— 注意几个概念:上限、下限、组距、组数。
组数过多,组距太小,要避免将相同性质的单位分到不同组中去; 反之,如果组数过少,组距太大,要避免将不同性质的单位分到同一 组中去。 3) 确定组限 ——(1 )客观数量界限。(2 )第一组的下限和最后一组 的上限。有极端值时,第一组和最后一组可采用开口组。(3)尽可能 采用5或10的倍数。 “上限不在内原则” 4) 确定分配次数 —— 可利用EXCEL表进行汇总。
人数 比重(%) f/∑f f 3 15 9 45 6 30 2 10 20 100
异距数列
2.2.4.2分布数列的种类
由于分组是分布数列的基础,因此有怎样的分组就形成怎样 的次数分布。 综合上述各种的分组,分布数列的类型,可归纳为:
品质数列
分布 数列
变量数列
单项数列 等距数列 组距数列 连续组距数列
男生
文科
本科
女生 男生 女生 男生
专科
理科
本科
女生
男生
专科
女生
3.按品质标志分组
按品质标志分组,就是选择反映事物属性差异的品 质标志作为分组标志,并在品质标志的变异范围内 划定各组界限,将总体划分成为若干个性质不同的 组成部分。
例如:人口总体按性别,分为男、女两组; 再如:企业总体按所有制,分为全民、集体、合 营、个体等组。
统计年鉴中按年 龄分组为:
0-14 15-64
少年 中青年
65岁以上 老年
2)组限的确定
当组距、组数确定后,只需划定各组数量界限便可 编制组距数列。
3)组中值的计算
组距数列掩盖了分布在组内各单位的实际变量值。 为了反映各组中个体单位变量值的一般水平,统计 工作中往往用组中值来代表它。 组中值是组内变量范围的中间数值,通常可根据备 组的上限、下限进行简单平均,即: 组中值=(上限+下限)/2
对总体只按一个标志进行分组,称为简单分组。 如:以产值作为划分企业规模的标志;按文化程 度对人口总体进行分组。
统计对总体往往要从多方面进行研究,仅仅依赖 一个分组标志进行分组是难以满足需要的,必须 运用多个分组标志进行多种分组,形成一个分组 体系,才能满足需要。
2.复合分组
对同一总体选择两个或两个以上的标志层叠进行分 组,就形成复合分组。 例如,为了认识我国高等院校在校学生的基本状况, 可以同时选择学科、学制、性别等三个标志进行复 合分组,得到如下分组体系。
如用相对数形式表示便是比率。比率是一种结构相 对数,各组比率之和应等于1或100%。
各组次数或比率的大小意味着相应的变量值在决定 总体数量表现中所起的作用不同。次数或比率大的 组,其变量值在决定总体数量表现中的作用就大, 反之就小。 由于社会经济现象性质的不同,各种统计总 体都有不同的次数分布,形成各种不同类型的分布 特征。
首组假定下限=首组上限-邻组组距………………(4)
组中值=上限-邻组组距/2
末组假定上限=末组下限+邻组组距………………(5) 组中值=下限+邻组组距/2
按成绩分组X组中值 Nhomakorabea60分以下 60-70分 70-80分 80-90分
90分以上
55
65 75
85
95
4)分布数列的次数
次数是分布在各组中的个体单位数。
10~15年 15~20年 20年以上 数量标志分组
统计分组的作用
1 、提示类型:统计分组的根本作用是将复杂的社会经济现象 按照统计认识的要求区分为各个性质不同的组成部分。 2.说明总体现象的内部结构。现象的内部结构是表明现象本 质特点的一个重要方面,将同一总体不同时期的结构联系起来, 还可以看到现象的发展趋势和规律。 3、反映变化。将总体的分组资料按时间的移动联系起来进行分 析,可以反映总体及各组在数量上的变动情况和变动规律。 4、分析总体现象之间的依存关系。通过分组将有相互影响的现 象联系起来进行研究,反映它们在数量上的变动规律。例如:商 品销售额与流通费用率的关系;居民收入与储蓄额的关系。
品质数 列
2.2.4.2分布数列的种类
由于分组是分布数列的基础,因此有怎样的分组就形成怎样 的次数分布。 综合上述各种的分组,分布数列的类型,可归纳为:
品质数列
分布 数列
变量数列
单项数列
组距数列
某组人群20个人年龄如下(单位:岁):
1,5,12,15,21,12,15,21,21,22,30,33,15,30,5,48,49,
4.按数量标志分组
按数量标志分组,就是选择反映事物数量差异的数 量标志为分组标志,并在数量标志的变异范围内划 定各组界限,将总体划分为性质不同的若干组成部 分。 例如,居民家庭按子女数分组,可分为0人 (无子女)、1人、2人、3人;等等。
例 1 为了了解某地区银行存款的构成,可以选用 存款性质、期限两个标志分别进行分组: 按存款性质分组 存款同时按其性质及期限分组 企业存款 企业存款 简单 储蓄存款 分组 活期 财政性存款 定期 按存款期限分组 品 储蓄存款 质 活期存款 活期 复合 标 定期存款 志 分组 定期 分 财政性存款 组 例2 企业职工按工龄分组: 活期 5年以下 定期 5~10年
1)确定组距和组数
单项数列不存在组距的问题
编制组距数列时,不仅要考虑各组的划分是否能区分总体内 各组成部分的性质差别,还需要确定适当的组距和组数,才 能准确而清晰地反映总体的分布特征。 在实际进行分组时,采用等距数列或异距数列,应决定于现 象的性质和研究的目的。标志值分布比较均匀时,一般用等 距数据;标志值分布很不均匀时,应采用异距数列 。
本科课程陈宜治系列课件
统计学
课件制作:陈宜治
2.2.3
统计分组
统计分组的含义 统计分组的种类
统计分组的 概念和原则
25%
33% 42%
概念 原则
根据统计研究的目的和客观现象的内在特点, 按某个标志(或几个标志)把被研究对象的总体 划分为若干个不同性质的组。
穷尽原则、互斥原则
文盲或识字不多 小学毕业 中学毕业(含中专) 大专毕业 大学及大学以上
例1:从业人员按文化程度分组 小学毕业 中学毕业(含中专) 大学毕业