当前位置:文档之家› 统计学 第 2章 数据的图表展示

统计学 第 2章 数据的图表展示

一、统计表的构成
1、 表头(表号、总标题)
2、行标题
3、列标题
4、数字资料
5、表外附加(注解说明或表脚)
二、统计表编制的基本要求
科学、实用、简练、美观
三、统计表种类 人口数字
全球人口 70亿
1、按用途分: 中国人口 13亿
印度人口 12亿 美国人口 3亿
调查表、汇总表、分析表
2、按时间和空间属性分: 日本人口 1.3亿 时间表、空间表、时空表 3、按分组情况分: 简单表:未分组的数据表。 简单分组表:单变量分组的数据表。 并行分组表:多变量分组并行排列的数据表。 交叉分组表(列联表):多变量分组交叉排 列的数据表。
8、数字要如实填写,不能用“同左”
文字表示;
9、合计应放在最后一行。
表2—2
2011~2012年中南商场部分商品销售统计表
计 量 单 位
件 台 吨
商 品 名 称
甲 乙 丙
销售额 (万元) 2011年 2012年 2011年 2012年
(1) 3000 50 800 (2) 3000 60 1000 (3) 30 500 160 (4) 27 540 180
20 18.23
18
16
14
13.65
GDP
12 10.71 10 8.75 8 2000年 2001年 2002年 9.59
(3)计量单位 若全表的计量单位一样,则放在 表外的右上角; 若全表计量单位不一样,则各行 的计量单位,专设一个计量单位栏; 各列计量单位,放在列标题(指标名 称)的左方或下方,并用圆括号括起 来。
4、表脚 填表人、填表时间、资料来源、变量 注解(计算方法、计算口径)等。
5、如果有多张表,则要编表号。 练习: 指出下表中的错误,并将其改正 为一张规范的统计表
例4 对人口年龄的分组,可根据人口成 长的不同阶段,采用不等距分组,分为 4 组: 0~ 6 岁 7~17 岁 18~59 岁 60岁以上 婴幼儿组 少年儿童组 中青年组 老年组
三、组距分组的具体方法 1、将原始数据排序,并进行初步分析 2、确定组数、组距 在全距一定时,组数与组距成反向变动 关系,一般依原始资料的集中与分散程度 进行综合考虑。先确定其中一个,再确定 另一个。 组数一般取5~15组,组距取 5、10或 者10%的整数倍。是采用等距还是不等距, 视资料的具体情况而定。
例1 某一车间有50个人,每人看管机器台数如下:
3、4、2、4、2、2、3、3、2、5、
2、2、4、3、5、4、3、5、5、3
3、4、4、3、4、5、4、4、2、4、 4、5、3、4、5、3、4、5、4、3、 4、2、3、2、4、2、3、4、4、3
表2-4
某车间工人看管机器台数统计表 人数 (人) 10 14 18 8 50 比重 (%) 20 28 36 16 100
(2)数字填写
数字单元格中要如实填写,不能空白。 ①同类数字,位数要对齐。
②特殊符号的使用
“—”表示没有数字或无用数字或无
法计算的数字;
“#”表示重要数据。
③数字格中不能填写文字(如不能 有“同左”、“同右”、“同上”、 “同下”等字眼)。 ④计量单位、百分号“%”都不能放 在数字格。 ⑤合计。数字合计一般放在最后一 行或最后一列。
表2-3 组别 一、按性别分 人数 — 组别 一、男生组 人数 34
1、男生组 2、女生组
二、按年龄分
34 16

1、18岁 2、19岁 3、20岁
二、女生组 1、18岁 2、19岁 3、20岁 合计
2 28 4
16 3 10 3 50
1、18 2、19 3、20
合计
5 38 7
50
三、频数分布表 (一)概念: 1、频数:在数据分组后,落在各组中的数据个数。 2、频率(比例):各组的频数与总频数之比。 3、频数分布:数据在各组中的分配。 (二)种类 1、定性分组表(用定性变量分组) 2、定量分组表(用定量变量分组) (1)单变量值分组表 (2)组距分组表
你相信这些统计结论吗?
内容提要
1.1 统计表的设计
统计表的结构、种类、编制要求
1.2 频数分布表的编制
数据的预处理(审核、排序、筛选、透视)
数据分组、频数分布表、组距分组表
1.3 常见的统计图
条形图、饼图、直方图、折线图、曲线图
1.4 频数分布的常见类型
钟形分布、U形分布、J形分布
1.1 统计表的设计
1、正确选择分组变量 2、具体分组的两种情况 (1)按不同的变量分组 A、定性变量分组: 简明的,自行处理; 复杂的,参照国家分类标准执行。 B、定量变量分组: 一般先确定组数,再确定组限。
(2)按不同的程度分组 A、简单分组:只用一个变量进行分组。 B、平行分组:多个变量分别进行简单分组。 C、交叉分组:多个变量进行交叉分组。
销售量
2012年 销售额 比重(%)
(5) 3.61 72.29 24.10
合计
——
——
690
747
100.00
1.2 频数分布表的编制
一、数据的预处理 1、数据审核
原始数据(完整性审核、准确性审核)
二手数据(适用性审核、时效性审核)
2、数据排序
3、数据筛选 4、数据透视表
二、数据分组
(一)数据分组的具体方法
表2-1
2012年中南商场部分商品销售统计表
销售量 销售额 2011年 (4) 690万元 50台 800吨 60台 1000吨 500万元 160万元 2012年 (5) 2012年的 销售额所 占比重 (6) 100.00% 72.29% 24.10%
商品 名称 (1) 合计 乙 丙
2011年 (2)
(二)饼图 (扇形图)
图2-4
图2-4
不同品牌饮料的市场占有率
18% 30% 12%
可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露
18%
22%
饼形图是用圆形及圆内扇形的面积来表 示数值大小的图形。它主要用于表示总体中 各个组成部分所占比重,用于研究总体的结 构性问题。 在绘制饼形图时,总体中各个部分所占 比重用圆内各个扇形面积在圆内所占比重表 示。各个扇形的中心角度,是用各部分所占 比重乘以360°得到的。
按看管机器台数分组 (台) 2 3 4 5 合计
例2 为了估计某天武汉市草莓的零售价格,市场调查员 在几大集贸市场和超市,访问了80个摊位,得到80个数 据,资料整理如下 :
表2-5
某天武汉市草莓价格统计表 摊位数目(个) 5 13 30 17 15 80
价格(元 / 斤) 5.5 6.0 6.5 7.0 7.5 合计
四、编制统计表的具体要求
1、标题 准确、简明(总标题包含时间、地点、内容)。 2、外观 大小适度、比例恰当、醒目美观。 (统计表一般为长方形的左右两边不封口的开 口表格。)
3、表中项目填写规范
(1)栏目编号 研究对象用甲、乙、丙 „文字,或
1、2、3等数字或A、B、C等字母编号;
研究变量用(1)、(2)、(3)等 数字编号。
例3
某公司300个职工工资的等距分组表。
表2—6
按工资分组 (元) 1000以下 1000~2000 2000~3000 3000以上 合计
人数 (人) 50 85 120 45 300
组距 (元) 1000 1000 1000 1000 —
组中值 (元) 500 1500 2500 3500 —
5 14 32 44 48 —
48 43 34 16 4 —
合计
向上累计人数: 表示各组上限以下的总人数;
向下累计人数: 表示各组下限以上的总人数。
(三) 变量、变量值
1.3 几种常见的统计图
(一)条形图
例1. 一家市场调查公司为研究不同品 牌饮料的市场占有率,对随机抽取的一家 超市进行了调查。调查员在某天对50名顾 客购买饮料的品牌做了记录,如果某一顾 客购买某一品牌的饮料,就在该品牌下记 录一次,结果整理如下表。
企业数 (个) 3 5 8 2 18
中百仓储水果湖店
2013年国庆营销活动说明表
表2-8
单张购物发票累计金额 (元)
返购物券 (元)
30~49 50~99 100~149 150~199 200以上
30~50 50~100 100~150 150~200 200以上
3 5 10 15 20
注意: ①在组距分组时,连续变量采用重叠组限, 离散变量采用重叠组限和断开组限都行。重合 组限是安全组限。 ②若采用重叠组限,则在数据归组时,要遵 循“上组限不在内”的归组原则。 ③组限、组距一般取整数,并以5或0为尾数。 4、统计各组的频数(“不重不漏”原则) 5、将分组结果编成频数分布表或绘成频数 分布图
(三)折线图 表2-11
年份 GDP (万亿元)
我国2000~2005年的GDP
2001 9.59 2002 2003 2004 2005
2000 8.75
10.71 11.67 13.65 18.23
根据上表,选择折线图,描述我国GDP 的变化趋势。
图2-5 我国2000-2005年GDP折线图
3、确定组限 重叠组限:用一个变量值表示相邻组 的上、下限。即用同一个数字表示相邻组 上一组的上限与下一组的下限。 间断组限:用顺序的两个变量值分别表 示相邻组的上、下限。相邻组的上、下限 衔接而不重叠。
练习:下面两张表,分组结果有什么差别?
表2-7
(一) 统计总体与总体单位
企业按职工人数分组 (人) 99以下 100以下 100~199 100~200 200~299 200~300 300以上 300以上 合计
2012年 (3)
相关主题