当前位置:文档之家› 第2章 描述统计学:表格法和图形法

第2章 描述统计学:表格法和图形法


根据数量型变量是离散性的还是连续性的, 可以分成两种情况:
(1)单项式分组:就是把每一个变量值作为 一组。这种方法通常只适于离散变量且变量 值较少的情况。
例2.1 某车间50个工人看管机床台数资料如 下:
3624326432425262 3543236542432235 4562264326345452 35
相对频数:一组的相对频数是所属组别的项目 个数占总数的比例。对一个有n个观测值的数 据集, 每一组的相对频数=每一组的频数/n
百分数频数:一组的百分数频数是相对频数乘 以100
相对频数分布是表示每一组的相对频数数据的 表格汇总。
百分数频数分布是每一组的百分数频数数据的 表格汇总。
表3 饮料购买次数的相对频数和百分比频数
(1)说明这些数据为什么是品质型数据
(2)做出汇总数据的频数分布和相对频数分布
(3)画出汇总数据的条形图和饼形图。
(4)在你汇总的基础上,说明顾客对理财顾问 的综合评价。
2.2 数量型数据汇总
2.2.1 频数分布 频数分布的定义与品质型数据一样,关键在 于对于频数分布的互不重叠的组的确定。 步骤: (1)确定互不重叠组的个数(分组) (2)确定每一组的组距 (3)确定组限
饮料 可口可乐 加多宝凉茶 百事可乐
康师傅冰红茶 雪碧 总计
频数 19 8 13
5 5 50
相对频数 0.38 0.16 0.26
0.10 0.10 1.00
百分数频数 38 16 26
10 10 100
2.1.3 条形图和饼形图
条形图:用来描绘已汇总的品质型数据的频数分 布、相对频数分布或百分数频数分布。 画法: 横轴——对数据分组的标记 纵轴——频数、相对频数或百分数频数的刻度 固定宽度绘制的长条放置在每一组的标记上,
当变量值变动范围较大时,最小组为“……以 下”,最大组为“……以上”的开口组。
第五,组中值的确定 组中值=(上限+下限 )÷2
开口组的组中值: 组中值=下限+邻组组距/2(缺上限) 组中值=上限-邻组组距/2(缺下限)
2.2.2 相对频数分布和百分数频数分布
相对频数:一个组的观测值占总数的比 例。对于n个观测值, 组的相对频数=组频数/n
2) 组距式分组 组距式分组就是将全部变量值依次划分为若干区间, 并将这一区间的变量值作为一组。 适用于:连续变量/离散变量且变量值较多
组距:等距分组适用于变量值的变动比较均匀 不等距分组适用于变动很不均匀,且变动幅度大
例:对学生成绩的分组可以分为 0~20分、20~40分、40~60分、60~80分、80~100 例:学生成绩分组也可分为 0~60(D) 60~80(C) 80~90(B) 90~100(A)
(1)这些数据是品质型数据还是数量型数据?
(2)给出这些数据的频数分布和百分数频数分布
(3)画出这些数据的条形图和饼形图?
(4)以样本为基础,哪个节目拥有最大的市场份 额?那个位居第二?
2.2011年某家商业银行顾客满意度调查,要求顾 客说明对他们的理财顾问是否满意。回答的等级 从1到7,其中1表示非常不满意,7表示极其满 意。假设对某个指定的理财顾问,由60个人回答 结果参见数据集银行.xls。请回答:
长条的高度为该组的频数、相对频数或百分数 频数。
对于品质型数据,应将这些长条分隔开,以强 调每一组是相互独立这一事实。
/通用格式
饮料购买次数的条形图
/通用格式
/通用格式
/通用格式
/通用格式
频数
/通用格式
/通用格式
/通用格式
/通用格式
/通用格式
/通用格式
可口可乐
加多宝凉茶
百事可乐 饮料
康师傅冰红茶
加多宝凉茶 百事可乐
雪碧 可口可乐
可口可乐 百事可乐
可口可乐 百事可乐
康师傅冰红茶 百事可乐
百事可乐
加多宝凉茶 可口可乐 康师傅冰红茶 雪碧
表2 饮料购买次数的频数分布
饮料 可口可乐 加多宝凉茶 百事可乐 康师傅冰红茶
雪碧 总计
频分数频数分布
表1 50次饮料购买的样本数据
可口可乐
可口可乐 可口可乐 雪碧
可口可乐
加多宝凉茶 百事可乐 加多宝凉茶 可口可乐 可口可乐 康师傅冰红茶
康师傅冰红茶 加多宝凉茶
雪碧
可口可乐
可口可乐 雪碧
加多宝凉茶 百事可乐
可口可乐 可口可乐
可口可乐 可口可乐
康师傅冰红茶 加多宝凉茶 百事可乐 百事可乐 加多宝凉茶 百事可乐 百事可乐 百事可乐 可口可乐 百事可乐 可口可乐 可口可乐
关键问题:分组数目的确定/组距的确定
以下主要介绍等距分组的基本步骤。 第一,数据排序 第二,分组数目的确定 使每组所包含的数据个数,平均不少于4个或5个, 或采用斯特吉斯经验公式,即
k=1+3.322lgN
k为组数;N为总体中的个体数。
表2-4 分组组数参考表
N 15~24 25~44 45~89 90~179 180~359
k
5
6
7
8
9
第三,组距的确定
组距=(最大值-最小值)÷组数
第四,组限的确定
组限的选择应做到第一组的下限应略低于最小 变量值,最后一组的上限应高于最大变量值。
离散型变量:相邻组的上下限可以不重叠
连续型变量:相邻两组的组限应重叠,即上一 组的上限同时也是下一组的下限。用“上限不 在内”原则解决重复问题
第2章 描述统计学 ——表格法和图形法
2.1 品质型数据汇总 2.2 数量型数据汇总 2.3 交叉分组表和散点图
2.1 品质型数据汇总
2.1.1 频数分布 频数分布:频数分布是一种数据的表格汇总,
表示在几个互不重叠组别中的每一组项目的个数 (即频数)。
软件操作:EXCEL中的函数 countif(range, criteria)的应用
雪碧
饼形图:描绘品质型数据的相对频数和百 分数频数分布的图形方法。
画法:
(1)一个圆形代表所有的数据 (2)圆形内包括若干扇形部分 (3)扇形与每一组的相对频数相对应
雪碧 10%
康师傅冰红茶 10%
可口可乐 38%
百事可乐 26%
加多宝凉茶 16%
饮料购买次数的饼形图
练习:
1.根据某媒体调查,在某段时间内,收视率最高 的4个电视娱乐节目是中国好声音、非你莫属、非 诚勿扰和天天向上。一个有50名电视观众的样本 数据参见电视节目.xls.请回答:
相关主题