数据整理与统计图表.ppt
排序按升序还是降序,要视数据及所反映的事物本 身的性质和研究目的而定。
5
二、 统计分组
(一)统计分组前的准备 先对数据做进一步的校对和校验,尽可能地消除记
录误差,同时按照一定的原则,剔除异常数据。 (二)分组应注意的问题 分组要以被研究对象的本质特性为基础。 分类标志要明确,要满足周延原则和互斥原则。
数据整理与统计图表
江西师范大学初教学院
2014-09
内容提要
数据初步整理 统计表
统计表的结构 统计表的分类 常用统计表的编制
统计图
统计图的结构 几种常用统计图介绍 其他类型统计图 数据类型与统计图选用
2
思考
某校学生的心理与教育统计成绩如下,根 据这些分数向上级部门提交一份报告。 71,81,74,61,78,79,68,67,81,79, 61,81,70,64,90,62,73,73,56, 52,79,70,69,63,74,87,52,57, 66,72,54,76,75,88,81,80,60, 63,80,74,77,69,53,48,66,83, 81,45,78,71
4
数据的初步整理
数据整理的基本方式有两种:排序和统计分组。
一、 数据排序
将一组数据按照数值大小、高低、长短、多少等, 依升序或降序排列,就可显示出数据的分布情况。
对字符型数据,如性别、职业类别等,汉字可依照 汉语拼音、笔画数等排序,英文可按字母顺序排序。
数据排序后,还可进一步划分等级,如考试分数排 序后可转化为优良中差等级别,也可确定名次。
6
(一)统计表的结构
表2-1 1989年全国培养研究生情况 (单位: 万人)
培养单位 高等学校
毕业生数 3.35
招生数 2.6
在校生数 9.1
科研机构
0.37
0.25
1.03
合计
3.72
2.85
10.13
注: 资料来源:《1989中国教育统计年鉴》,人民教育出版社出版
7
表2-2 高考河南省英语各种题型得分率(理科)
1
1
67
92~
2
3
66
88~
3
6
64
84~
6
12
61
80~
14
26
55
76~
15
41
41
72~
13
54
26
68~
8
62
13
64~
4
66
5
56~
1
17 67
1
练习
P27第1题资料,编制: 分组次数分布表 累加次数分布表 累加百分数表
18
四、 统计图 (一)统计图的结构
19
(二)几种常用统计图
直方图 次数多边图 累积次数分布图
80.0
85.0
90.0
分数 95.0 100.0 105.0 110.0
图2.2《教育统计学》成绩的直方图
23
次数多边图
1. 在直方图的基础上,把直方图顶部的中点(组中值 )用直线连接起来,再把原来的直方图抹掉
方法有很多,所以要弄清楚每组的实上限和实下限)
表2.2 某班《教育统计学》成绩
分数
人数
60以下
1
60~70 这一组的实下限为 59.5,实上限为69.5.它是左 闭右开的区间:[59.5,69.5)
60~70
3
70~80
8
80~90
12
90~100 总计
14 15 38
分组次数分布表的绘制(续)
求组中值
表2.3《教育统计学》成绩次数分布表
相对 累积 累积相
组中值 实下限 实上限 2
分数区间 96~
次数 1
次数 0.01
次数 对次数 1 0.01
归类划记
92~
2 0.03 3 0.04
88~
3 0.04 6 0.08
登记次数
84~
6 0.09 12 0.17
80~ 14 0.20 26 0.39
主要用来表示连续数据在各个分组区间内的散布情况
编制次数分 布表的步骤
求 定定 全 组组 距 数距
求求 组组 限中
值
14
归登 类记 划次 记数
分组次数分布表的绘制
全距(R) Rxmaxxmin 定组数(k)经验组数5-20;或 k1.8(7N1)2/5
求组距(i) i全距 /k
写出组限 (组限是每个组的起始点界限,组限的表述
3
数据的初步整理
统计表和统计图是对数据进行初步整理,以简 化的形式加以表现的两种最简单的方式。
在对数据进行统计分类以后,得到的各种数量 结果称为统计指标。
统计指标和被说明的事物之间的关系用表格的 形式表示就成为统计表。统计表具有简明、清晰、 准确的特点。
统计图是依据数字资料,应用点、线、面、体、 色等描绘制成的图形,是统计数据资料的可视化显 示方式。统计图比统计表更为具体形象。
76~ 15 0.21 41 0.61
72~ 13 0.19 54 0.81
68~
8 0.11 62 0.93
64~
4 0.06 66 0.99
56~
1 0.01 67 1.00
16 总计
67
1
3、累积次数分布表
表2.4《教育统计学》成绩累积次数分布表 分数区间 次数 向下累积次数 向上累积次数
96~
客观题
主观题
全卷
1993年 1994年 1993年 1994年 1993年 1994年
题量 85
80
1
16
86
86
分值 85
110
15
40
100
150
平均分 52.36 63.63
7.36
17.4 61.92 81.03
得分率 0.616
0.578
0.491 0.435
0.619 0.540
8
三、统计表 (一)统计表的结构
直方图
1. 用矩形的宽度和高度来表示频数分布的图形,实 际上是用矩形的面积来表示各组的频数分布
2. 在直角坐标中,用横轴表示数据分组,纵轴表示 频数或频率,各组与相应的频数就形成了一个矩 形,即直方图(Histogram)
3. 直方图下的总面积等于1
21
直方图(续)
一眼就可以看 出大多数学生
的成绩在 76~80分
其中,表号、名称、标目、数字、线条必不可少。
9
(三)统计表的编制要求
10
(四)常用统计表的编制 简单次数分布表 分组次数分布表 累积(累加)次数分布表
11
1.简单次数分布表
依据每一个分数值在一列数据中出现的次 数或总计数资料编制成的统计表。常用于 离散数据类型。
12
13
2.分组次数分布表
矩形下 的面积 和为1
图2.1《教育统计学》成绩的直方图
22
直方图
(异常值)
20
人 数
一组资料的任何 图形的异常值 (outlier),是指 落在图形一般形 态之外的观测值。 如左图中,有两 组的人数特别少。 这两组分别是45 和100这两组
10
0
45.0
50.0
55.0
60.0
65.0
70.0
75.0