当前位置:文档之家› 统计学数据处理的基本思路

统计学数据处理的基本思路

统计学数据处理的基本思路
数据的整理是数据收集与数据分析之间的中间环节数据整理是对收集来的数据进行加工整理使之符合统计分析的需要。

如对数据进行图表显示,以发现数据中的基本规律。

数据整理的中心任务就是分组与编制频数分布表。

而数据处理的主要步骤又包括以下几点:数据的预处理,数据的分组,数据的整理与显示,统计表。

数据整理是所以步骤的第一步,也最为重要。

统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中,发挥着承上启下的作用。

其中,在数据的预处理中,把混在原始数据中的“异常数据”排除、把真正有用的“信息”提取出来。

因此,对异常数据的剔除就显得尤为重要,其中又包含多种方法,主要有1、根据人们对客观事物已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,在实验过程中随时判断,随时剔除。

2、给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常数据剔除。

比如,在对一个班的同学的身高做调查的时候,可以依据常识,在列表中对那些明显不符合的数据做剔除处理,即身高中出现2米多的数据,依常识不可能。

再则,预处理完毕后,则需要对数据进行分组。

通过分类发现数据内部的特点。

例如,在对全班身高进行整理后得到数据,可以对之进行不同的分组,如分男女生,如分不同高度段等等。

通过分组发现数据内部结构的特点。

即有所谓的类型分组,分析分组,结构分组等等。

第三,就是数据的整理与显示。

包括的重点有:1、频数(落在各类别中的数据个数。

)2、频率(某一类别数据的频数占总体单位个数的比重。

)3、频数分布(把频数以表格形式全部列出就是~绘制频数分布表的演示操作(调用Excel文件:分类数据的整理)4、比例(各类数据与全部数据之比)5、百分数(把比例基数100化比率:各类数据间的比值)。

这些处理是下一步的前提与基础,为绘图做准备,比如在对全班身高完成分组后,可以依据一定的需要,对其进行整理与显示,如要研究男女身高的差异,可以分别理出男女身高的平均数,频数,频率,频数分布,比例,百分比等等数据。

然后根据需要对其进行显示。

最后一步,就是绘图。

其中不同的需要目的需要不同的图形予以显示。

图形主要有条形图,直方图,饼状图,折线图等等。

以条形图为例,长度表示各类频数的多少,而宽度则一般固定。

用于显示各数据直观上的绝对多少。

其他图形依然。

所以,综上述,基本思路即包括数据的预处理,数据的分组,数据的整理与显示以及绘图。

(由于不会word绘图功能,故相关事例绘图滤去)。

相关主题