当前位置:
文档之家› 应用统计学第2章统计表统计图
应用统计学第2章统计表统计图
对数图可以直观反映时间序列的环比变化趋势
可以在Office图表类型中选择自定义类型中的“对数图” ,也可通过将一般折线图纵轴“坐标轴格式” 中的“刻度” 设为“对数刻度”来绘制对数图。
例:某公司总成本和劳动成本的增长
该公司总成本和劳动成本每年增加相同的数量 ,因而用绝对数据作图时两条线是平行的,不小心 可能会得出劳动成本占总成本固定比例的误解。实 际上第1年占40%,第6年占60%。使用对数图就可以 清晰反映劳动成本有更高的增长率。
“平滑线”复选框,就将折线图转换为曲线图。
⑵经济管理中几种常见的频数分布曲线
①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的一
类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度
,某种农作物的产量等等。
正态分布曲线
②偏态曲线
——按其长尾拖向哪一方又可分为右偏(正偏)和 左偏(负偏)两类。
1.频数分布表
频数分布表列出了一系列分类数据的频率、总数 或百分比,可以看出不同类别数据间的区别。
表2-1 1 000美元用途的频数分布表
用钱做什么 购买奢侈品、旅游或礼物 向慈善机构捐款 还贷 储蓄 购买必需品 其他
百分比/% 20 2 24 31 16 7
2.条形图
3.圆饼图
4.帕累托图
L = [ 10 × log 10 n ] 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
未分组数据—茎叶图(茎叶图的制作)
树茎 树叶
数据个数
10 788
3
11 022347778889
接收区间——各组上限值组成的一列区域 功能:返回各组的频数。
②使用【工具】→“数据分析”→“直方图”功能
其它数值数据统计图
统计图可以形象、直观、生动、简洁地显示数据 的特征。 常用的统计图有以下几种: 1.折线图 ——通常用来描述时间序列数据,用以表示某些 指标的变化趋势。 制作折线图时应正确选择坐标轴轴的刻度。对同 样的统计资料,延伸或压缩某一坐标轴可能传达 不同的甚至是误导的印象。
时间序列图:研究数值变量随时间变化的趋势。X轴 代表时间,Y轴代表数值。时间序列图可用折线图 来实现。
曲线图:当变量是连续型数据时,通常使用曲线图 来描述数据的分布情况,如连续型随机变量的密 度函数和分布函数曲线。
6.散点图、时间序列图和曲线图
⑴ Office 中曲线图的绘制 方法一:使用“平滑线散点图”绘制 方法二:将折线图转换为曲线图 右击折线后选择“数据系列格式”,在“图案”标签下选
对数图反映了劳动成本增长率大于总成本增长率
§2.4 交叉表
交叉表可以由列联表和并行条形图来表示。 1.列联表 列联表表示两类变量的结果。横轴表示一类变量 ,纵轴表示另一类变量。值位于横纵轴的交叉处, 称为单元。根据列联表的结构类型,每横纵轴组合 单元包含频率、总值的百分比、横行的百分比或列 的百分比。 2.并行条形图 一个更有效的显示交叉分类数据的方式是作并行 条形图。
右偏(正偏)
左偏(负偏)
图1.8 偏态曲线 例如收入和财富的频数分配曲线就是右偏的,大量财富 都集中在极少数富豪手中,而多数人则是低收入者。
此外,在产品质量管理中也普遍存在这种现象,如多数 次品都集中出在少数工人手中;次品也大都出在少数几道 工序上。这就要求在管理和控制上需要突出重点、抓住关 键因素。
计指标时要用到。通常取该组上限和下限的平均 值为组中值。如表2-7所示,10~19的组中值是14.5 ,20~29的组中值是24.5,等等。 5) 表格线 统计表中的表格线应当是两边开口的表格。
使用 Excel 制作频数分布表
①利用 Excel 的 FREQUENCY 函数 语法规则: 格式:FREQUENCY(<数据区域>,<接收区间>)
样本容量 n
参考分组数
20~50 51~100 101~200 201~500 501~1000 1000以上
5~6 7~8 8~9 9~10 10~11 11~20
制作频数分布表的注意事项
2) 分组的方法 分组的方法可以有等距分组和不等距分组两类。 采用哪种分组方法应根据数据的分布特点而定。 通常,当数据在一定范围内基本呈对称分布时, 宜采用等距分组;而当数据的分布状态极度偏斜 时,则宜采用不等距分组。
在帕累托图中,不同类别的数据是按其频率降序 排列的,并在同一张图中画出累积百分比图。帕 累托图可以体现帕累托原则:数据的绝大部分存 在于很少类别中,极少剩下剩余的数据分散在大 部分类别中。这两组经常被称为“至关重要的极少 数”和“微不足道的大多数”
§2.2 数值数据的整理
当数据量很大时,首先可以将数值数据进行排序或用 茎叶图描述以获得初步信息。
③ J 形曲线
正J形
倒J 形
图1.9 J 形曲线
其典型的应用分别是经济学中的供给曲线和需求曲线。 供给曲线(正 J 形)表现为随着价格的增加,供给量以更
快的速度增加; 需求曲线(倒 J 形)表现为随着价格的增加,需求量以更
快的速度减少。 供给和需求曲线的交点即供求平衡点。
④ U形曲线
——又称生命曲线或浴盆曲线
§2.3 数值数据的图表
当数据量很大时,排序和茎叶图都很难得出结论 。此时需要使用图表。有多种不同类型的图表可 以用来精确描述数值数据,包括频数分布表、折 线图、面积图、柱形图、条形图、直方图、频数 多边形、圆饼图、散点图、时间序列、曲线图以 及对数图等等。
例:某公司汽车销售量 (单位:辆)
1.频数分布表
13
12 0012222333344466777889 24
13 0133445799
10
茎叶图类似横置 的直方图
某车间工人日加工零件数的茎叶图
4.频数多边形
频数多边形是直方图的另一种表现形式,是由直 方图的顶端中点(各组的组中值)连线而成,其中两 边都要连接到横轴上的某点,以便通过覆盖的面 积反映总频数。当希望在一个图上比较两种频数 分布的特征时,就需要使用频数多边形。
——主要用于表示时间序列数据。
柱形图示例
图1.4 各类进口商品的变化情况
(2)直方图——用以表示数据的频数分布规律。
图1.5 比特公司啤酒销售量的频数分布
未分组数据的茎叶图
• 用于显示未分组的原始数据的分布 • 由“茎”和“叶”两部分构成,其图形是由数字组成的 • 以该组数据的高位数值作树茎,低位数字作树叶 • 对于n(20≤n≤300)个数据,茎叶图最大行数不超过
§2.5 图表汇总和制作原则
分析类型 单变量值的图表数据类型
分类
排序,茎叶图,频数分布表,折 线图,直方图,面积图,柱形图 和条形图,圆饼图,频数多边形
汇总表,条形图,圆饼图, 帕累托图
散点图,时间序列图,曲线图
列联表,并行条形图
图表选择指导
(1) 排序 从没有排序的数据中很难看出数据的整体范围。排序
是把数据从小到大(或从大到小)进行排列。 (2) 茎叶图
茎叶图就是将数据分成几组(称为茎),每组中数据的 值(称为叶)放置在每行的右边。结果可以显示出数据是如 何分布的,以及数据中心在哪里。
为了制作茎叶图,可以将整数作为茎,把小数(叶)化 整。例如,数值5.40,它的茎(行)是5,叶是4;数值4.30, 它的茎(行)是4,叶是3。也可以将数据的十位数作为茎, 个位数作为叶。
男、女学生的体重分布特征
5.圆饼图
当要表示总体各组成部分的个体数量在总体中占 的比率时,经常使用圆饼图,圆饼中各扇形的大 小代表了不同组成部分的相对重要性。
某企业资产、负债与所有者权益的构成情况
6.散点图、时间序列图和曲线图
Microsoft Office中的曲线图属于平滑线散点图 。
散点图:在回归分析中,经常需要用样本数据的散 点图来分析两个变量之间大致的曲线关系,如正 相关关系,即一个变量的增长引起另一个变量的 增长;负相关关系,即一个变量的增长引起另一 个变量的减少。
注意:Excel在制作频数分布表时采用的是“上限在内” 的规则。
不重叠组限——相邻组的上下限不重合。 适用于离散型变量。
例:离散型变量的分组(不重叠组限)
某公司某月汽车销售量的频数分布表
例:连续型变量的分组(上限不在内)
某企业职工工资的分组统计
制作频数分布表的注意事项
4) 组中值 组中值是各组的代表值,在计算分组数据的许多统
图1.10 U形曲线
人和动物的的死亡率、设备的故障率等通常都服 从于 U 形曲线分布。
7.对数图
人们经常对时间序列变量的相对变化率而不是绝对数值 的变化感兴趣,如各种经济变量的环比发展速度。此时若要 用统计图直观反映增长率等现象的变动趋势,就需要使用对 数图。
对数图是以时间为横轴,以10为底的对数比率刻度为纵 轴的折线图。可以通过对数图中各线段的斜率比较各时期增 长率的大小。考虑以下统计数据:
例: 按雇工人数分组的私营企业规模统计
制作频数分布表的注意事项
3)组限:组限也即各组区间的上、下限。确定各 组区间的上限和下限时,应保证各组之间既不重叠 ,又不能遗漏任一数据,使每一个数据都属于某一 确定的分组。
重叠和组限不重叠组限
重叠组限——相邻组的上下限重合。
适用于连续型变量。但各组上、下限中有一个不包含 再内。通常按“上限不在内”处理,即组区间是 [a, b)的形 式。
过分压缩了Y轴
图1.2 失业人数统计图
过分压缩了X轴
图1.3 失业人数统计图
2.面积图
面积图可以直观地表示时间序列各组成部分的变 化情况。
图 某地区各产业增加值构成比例的变化情况