一、思考题
3.1数据的预处理包括数据审核,数据筛选,数据排序,数据透视表。
3.2分类数据整理:频数分布表(频数,比例,百分比,比率)
图示方法:条形图,对比条形图,帕累托图,饼图。
顺序数据的整理:频数分布表(累计频数,累计频率)
图示方法:环形图。
3.3数值型数据的分组方法是组距分组,步骤:
1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,组数一般为5≤K ≤15
2.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即
组距=( 最大值 - 最小值)÷ 组数
3.统计出各组的频数并整理成频数分布表
3.4直方图和条形图区别:
1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的
2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义
3.直方图的各矩形通常是连续排列,条形图则是分开排列
4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3.5绘制线图应该注意的问题:
一般情况下,纵轴数据下端应从“0”开始,以便于比较。
数据与“0”之
间的间距过大时,可以采取折断的符号将纵轴折断
3.6饼图和环形图的不同:
饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。
3.7茎叶图与直方图相比的优点与各自的应用场合:
直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。
直方图适用于大批量数据,茎叶图适用于小批量数据
3.8鉴别图表优劣的准则有:
3.9制作统计表时应注意的问题:
二、练习题
3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别为:A.好;B.较好;C.一般;D.较差;E.差。
调查结果如下:(见Excel3.1)
要求:
(1)指出上面的数据属于什么类型。
顺序数据
(2)用Excel制作一张频数分布表。
(3)绘制一个条形图,反映评价等级的分布。
(4)绘制评价等级的帕累托图。
3.2为了确定灯泡的使用寿命,在一批灯泡中随机抽取100个进行测试,所得结果如下:(见Excel3.2)
要求:
(1)利用计算机对上面数据进行排序。
(2)以组距为10进行等距分组,整理成频数分布表。
(3)根据分组数据绘制直方图,说明数据分布特点。
分布特点:单峰正态分布。
(4)制作茎叶图,并与直方图做比较。
均集中在680~730之间。
3.3一种袋装食品用生产线自动装填,每袋重量大约是50克,但由于某些原因,每袋重量不会恰好是50克。
随机抽取100袋食品,测得的数据重量数据如下:(见Excel3.3)
要求:
(1)构建这些数据的频数分布表。
(2)绘制频数分布的直方图。
(3)说明数据分布的特征。
食品重量主要集中在45~55之间。
3.4给下面的数据绘制散点图。
(见Excel3.4)
3.5甲、乙两个班各有40名同学,期末统计考试成绩分布如下:(见Excel3.5)
要求:
(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。
(2)比较两个班考试成绩分布的特点。
甲班不及格人数多于乙班。
(3)画出雷达图,看看两个班考试成绩的分布是否相似。
两班成绩分布显然不相似。
3.6 1997年我国几个主要城市各月份的平均湿度数据如下表所示(单位:%),试绘制箱线图,并分析各城市平均相对湿度的分布特征。
(见Excel3.6)。