当前位置:文档之家› 第三章 统计资料整理

第三章 统计资料整理

第三章统计资料整理通过统计调查所取得的资料只能反映总体各单位的具体情况,是分散的、零碎的、个别的,要说明事物的总体情况,揭示总体的一般情况,还需对这些资料进行加工整理,才能对总体做出概括性的说明。

1、统计资料整理的一般问题(1) 统计整理的概念、作用、重要性统计整理是根据统计研究的目的和要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已经初步加工的资料进行再加工,使之成为系统化、条理化的综合分析,以反映现象总体特征的工作过程。

统计整理是整个统计工作的中间环节,统计整理是统计调查的继续,又是统计分析的基础,具有承前启后的作用。

统计调查所搜集到的资料只有经过科学的审核、分类、汇总等整理工作,才能实现由个体到总体、由现象到本质、由感性到理性的转变。

(2) 统计整理的程序1、制定整理方案2、数据审核就是对搜集到的资料进行全面审核,主要检查数据的完整性(是否遗漏)和准确性(是否可靠),如果发现问题,及时纠正,以保证搜集的资料准确无误,这是统计工作十分重要的环节,必须认真对待。

3、划类分组根据研究目的和统计分析的需要,对原始资料进行分组分类。

例如:研究性别构成可以按性别分组;研究不同职业的工资水平可以按照职业分组,又可以按照某一组距进一步细分。

4、综合汇总即在分组的基础上,将各项资料进行汇总,得出反映各组和总体的总量指标。

例如:女性总人口数、男性总人口数、总人口数;金融业人均工资、会计类人均工资、教师类人均工资、公务员人均工资、农民工人均工资等。

(注意:前者总量指标,后者为平均指标)5、制表制图将整理出来的统计结果用统计表或统计图的形式反映出来,表述统计资料的内容6、积累保管即统计资料的积累的保管。

因为统计研究中要经常进行动态分析,这就需要长期积累统计资料。

(3) 统计整理的技术1、手工汇总手工汇总是指以算盘和计算器为主要工具,通过手工操作对统计资料进行汇总。

由于手工汇总速度慢、易出错,取而代之的是现代化汇总技术——计算机汇总2、计算机汇总计算机汇总是指通过计算机来进行统计汇总的一种技术手段。

计算机汇总具有计算容量大、速度快、准确性高的特点,而且还能还能进行数据储存、自动运行程序(例如Excel在统计中的应用)等,这些都是手工汇总无法比拟的。

(4) 统计整理的组织形式1、逐级汇总(自下而上逐级对调查资料进行汇总)2、集中汇总(将所有调查资料集中在制定部门进行汇总)3、综合汇总(上面两者的结合)2、统计分组(1) 统计分组的概念统计分组就是统计整理的第二个环节,对调查资料按照统计研究的需要进行分组。

例如:对全班同学按年龄分组可以知道年龄构成,按成绩分组可以知道学习状况,按生源地分组可以知道地域分布状况,按户口类型分类可以知道城乡学生比例。

(2) 统计分组的作用由上可见,通过统计分组可以区分社会经济现象的类型,可以反映社会经济现象的内部结构,可以分析社会现象之间的依存关系(比如收入与支出之间的关系、销售量与价格之间的关系)。

(3) 分组标志的选择统计整理的关键在于统计分组,而统计分组的关键又在于分组标志的选择。

分组标志就是划分各组的依据。

比如上面的年龄、成绩、生源地、户口类型等。

到底如何确定分组标志呢?原则有下:1、要根据研究的目的确定例如:同样对于工业企业这样一个总体分组,当研究工业企业的规模结构时,应选择“生产能力”作为分组标志来说明大中小型企业的构成情况;当研究工业企业部门结构时,应选择所属“部门”进行分类。

根据不同的研究目的,选择合适的分组标志,才能使统计分组的资料更好地满足研究的需要。

2、要选择最能反映事物本质特征的标志如果能够说明目的的标志有多个,则需要抓住具有本质特征的关键性标志作为分组的依据。

如上例中对企业规模的划分,就有多个标志,如企业职工人数、企业固定资产、生产能力、占地面积等,无疑只有生产能力最能够体系企业的规模,生产能力才是最具有本质特征的标志。

3、要结合历史条件和具体情况即选择分组的标志不是一成不变的,需要以一定的时间、地点、条件为转移。

如研究工业企业生产能力的问题,在机械化程度较低的情况下,生产能力的大小主要取决于劳动力的数量,那时候就可以把职工人数作为主要标志。

但在现代化工业企业中,机械化程度很高,职工人数的多少不再是决定生产能力的关键因素了,取而代之的是固定资产,因而我们研究工业企业生产能力的时候也必须选择固定资产来作为分组标志。

(4) 统计分组的方法1、按品质标志分组2、按数量标志分组(1) 单项式分组(2) 组距式分组(5) 统计分组的形式1、简单分组2、复合分组3、分配数列(1) 分配数列的概念统计分组以后,调查资料就变成了由若干小组数据按一定顺序构成的分配数列。

分布在各个组的总体单位数叫次数(频数),各组单位数(即次数、频数)占总体单位数的比重称为频率。

例如:第六次全国人口普查结果(大陆地区)标志人数(人)比率(%)性别男性68685257251.27%女性65287228048.73%年龄0-14岁22245973716.60%15-59岁93961641070.14%60岁以上177********.26%总人口1339724852(2) 分配数列的分类1、品质数列即按照品质标志进行分组所形成的分配数列,用来观察总体单位中不同属性的单位分布情况。

例如按组织形式将企业分为股份公司、合伙企业、合资企业等;按照文化程度将人分为大学及以上、高中、初中、小学、半文盲、文盲等。

2、变量数列即按照数量标志进行分组所形成的分配数列。

例如研究居民家庭贫富状态时,按恩格尔系数分组,60%以上为贫困家庭、50%~60%为温饱家庭、40%~50%为小康家庭、40%以下为富裕家庭。

根据总体各单位数量变动的特征,有两种分组方式(单项式分组、组距式分组):(1) 单项数列即按照单项式分组所形成的分配数列,也就是每一个变量值都成一组,一般适用于离散变量,而且变量值不多。

例如:按照家庭孩子数量来对家庭进行分类:孩子数量(个)家庭数量(户)123(2) 组距数列即按照组距式分组所形成的分配数列,也就是按变量值的一定范围来进行分组。

例如前面关于贫富状况的分组、按照年龄进行的分组等,这种分组非常常见。

这种分组方法涉及到一些概念:闭口组:上限呵呵下限都齐全的分组开口组:上限下限缺其一的分组组限:就是分组的数量界限。

上限(改组的最大值)和下限(改组的最小值)组距:就是每一组的上限与下限之差。

所有分组中组距都相等的分组叫等距分组,不相等的叫异距分组。

组数:即有多少组数据。

组数的多少和组距的大小呈反比例关系。

组中值:即各组变量值的代表性水平,是各组上限与下限的中点值。

闭口组条件下:组中值=(上限+下限)/2开口组条件下:却下限的组中值=上限-邻组组距/2缺上限的组中值=下限+邻组组距/23、变量数列的编制(1) 单项数列的编制如果分组标志是由离散变量组成,并且变动范围不大时可以编制成单项数列。

如前面所述按照家庭孩子数量对家庭的分类;再如按照每年进电影院观看电影的次数对学生进行分类。

(2) 分组数列的编制很多经济现象不适合用单项数列进行分组,那样太繁琐而且没有统计意义。

举例:加入按单项方式对学生成绩进行分类,那就是0分的有多少学生、1分的有多少学生……显然这样不具有统计意义。

这是就需要编制分组数列。

那么到底编成等距数列还是异距数列?这还取决于标志值变动的具体情况。

举例:如果学生成绩如下:51、52、63、65、66、69、75、76、77、78、79、74、72、76、80、85、91。

就可以按照组距为10编制等距数列,同样可以编制成异距数列:60分以下、60~70分、70~80分、80~90分、90~100分。

1) 等距数列的编制排序→求全距→确定组距→求组数→计算各组的次数或频数→制作频数分布表。

举例:再给学生一个练习。

2) 异距数列的编制当标志值变动很不均匀、遇偏遇斜的情况下,应编制成异距数列。

根据经验确定组距。

4、关于次数的两个问题(1) 累计次数分布次数研究是统计研究的一个基本问题。

累计次数分布是将各组变量的次数和频率逐组累计相加,它表明总体的某一标志值在某一水平上下的总体次数和比率。

累计的方法有两种:向上累计和向下累计(2) 次数分布的主要类型1、钟形分布次数呈现“两头小、中间大”的特征,即靠近中间的变量值分布的次数较多,靠近两端的变量值分布的次数较小。

2、U形分布U形分布的特征与钟形分布恰恰相反,是“两头大中间小”,即靠近中间的变量值分布的次数较小,靠近两端的变量值分布的次数较多。

3、J形分布J形分布的特征是“一头大一头小”,即多数变量值集中在某一端。

5、统计数据的显示经过统计整理以后的资料有数据资料和文字资料两大类。

其中,数字资料的条理化、科学化往往通过统计表和统计图显示出来,因此,统计表和统计图称为显示统计资料的重要工具。

(1) 统计表统计表就是把统计数据按照一定的结构和顺序,用表格的形式显示出来。

统计表的运用十分广泛,其主要优点:表格式的列示不仅使得数据显示简明易懂,而且使得统计资料条理化,也便于计算和比较表内各项总统计指标。

1、统计表的构成(见教材)从形式上看,由总标题、横标题、纵标题、数字资料四部分组成从内容上看,由主词、宾词两部分组成2、统计表的分类(1) 按分组情况:简单表、分组表、复合表简单表:是指对总体未作分组,仅按时间顺序等排列而成的统计表。

分组表:是对总体单位按照一定的标志进行分组而形成的统计表,如上按照由低到高对身高的排序。

复合表:是对总体的统计单位按两个或两个以上标志进行交叉重叠分组而形成的统计表。

按作用分类:调查表、汇总表和分析表调查表:主要应用在调查资料中的登记、搜集原始资料环节汇总表:用于对统计资料的整理、汇总分析表:用于统计分析的表格举例:对本班学生的身高情况的研究按照学号一次进行测量,得到41个身高数据(调查表)→把这些身高数据进行从低到高排序,并按一定的组距进行分组,可以计算每组的次数、频率(汇总表)→分析本班学生的平均身高,对比标准身高或其他总体平均身高或全国同龄人平均身高评价本班学生身高状况(分析表)。

(2) 按时空性质不同:空间数列表和时间数列表空间数列表:即静态表,是反映同一时间条件下不同范围内的统计数据的表格。

例:2008年我国土地构成状况时间数列表:即动态表,是反映同一空间条件下不同时间上的统计数据的表格。

例:近十年来我国GDP发展状况。

两者也可以结合起来显示统计数据。

3、统计表的编制原则(1) 制表外观简洁大方(2) 统计表的标题、项目、指标简明扼要,能准确反映内容(3) 如须合计时,合计栏一般在最后一行或最左一列或最右一列(4) 表中数字应根据纵横关系对位,为零时应写为“0”,没有数字的标记为“—”;缺失某项数字时“……”,相同的数字不能用“同上”之类的词语表示。

相关主题