EXCEL与数据分析
(5)按下F2+Ctrl+Shift+Enter,得到频数分布表:
学生年龄频数分布表
年龄(岁) 18 学生人数(人) 2
19
20 21
21
55 17
22
合计
5
100
7
进一步可将频数分布表做成频数分布图: 选中“学生人数”下方的数据区域→单击图表向导 →选择柱形图,初步完成频数分布图:
学生年龄分布图
31
注:这个结果是平均复利或平均发展速度。要计算平均收益 率或平均增长率,就要通过公式计算: =几何平均数的计算结果-1
四、众数和中位数
和定性数据的计算一样,EXCEL中计算众数是通
过插入函数MODE(number1,number2,……)来实
现的;而计算中位数是通过插入函数MEDIAN (number1,number2,……)来实现的。
个数较多的离散型数据,实际中要采用组距式分组,
并在此基础上进行频数分析,以揭示数值型数据的 分布特征。
这里首先要解决的问题是,数据总体可分为多少组, 每组的组距是多大,组限是多少。具体分组时先算
出极差(最大值-最小值),观察数据变动的最大范
围,然后结合数据的特征来划分,为了计算上的方 便,一般会以10及其倍数为组距。
11
组距式数组的频数分布表的制作,可通
过两种方法实现:
第一种方法:通过插入频数分布函数
(FREQUENCY)实现
第二种方法:通过“数据分析”命令中的 “直方图”工具实现
12
第一种方法:通过插入频数分布函数
(FREQUENCY)实现
采用插入FREQUENCY函数实现,应首先将各组的 组上限按升序输入工作表, FREQUENCY函数将对应 于各组组限,计算大于上一组组限、小于等于本组组限
中的对象插入”,并选好工作表名即可。
23
三
集中趋势程度的分析
1、集中趋势的测定内容
2、算术平均数
3、几何平均数 4、众数和中位数
24
一、集中趋势的测定内容
对大量数据整理之后,大多数情况下数据都会呈现
出一种钟形分布,即各个变量值与中间位置的距离越近,
所出现的次数越多;与中间位置的距离越远,出现的次 数越少,从而形成了以中间值为中心的集中趋势。这个 集中趋势是现象共性的特征,是现象规律性的数量表现。 一般来说,在进行数据分析中,利用平均数来描述总体
3
例:单项式分组
某班学生年龄分布表
年龄(岁) 18 19 20 21 22 合 计 人数(人) 1 12 22 13 2 50
4
例:组距式分组
某厂工人按日产量分组表
按日产量分组(件) 工人数(人)
130-140 140-150 150-160 160-170 170-180
合 计
3 9 26 8 4
29
(4) 选中所有xf 相乘的数据结果单元格,单击工 具栏中的“∑”,即得到∑xf 的数据结果; (5)在其相邻单元格中输入公式“=C5/B5” →单击 “Enter”,即出现工人平均工资的数据计算结果: 2460。 算术平均数是反映现象集中趋势特征的最重要的 指标,是表明同类社会经济现象中各个个体在一定时 间、地点条件下所达到的一般水平,具有较高的代表 性。在实际中用途广泛,常可以用于比较同一时期同 类现象在不同单位、不同地区间的一般水平,也可以 作为评断事物的一种客观标准或参考。
并不是真正意义上的“直方图”,而是“柱形图”。直方 图与柱形图的重要区别是:直方图的各个条形之间没有间 隔,而柱形图有。因为直方图是根据数组结果绘制的,而 分组是连续的,因而对应的条形间是挨在一起不能分开的。
为此,必须对图形作进一步的修饰。
16
第二节
利用数据透视表进行分析
一、创建数据透视表
二、编辑数据透视表
个数据,划分为若干组,每组的组中值为xi ,每组数据
的频数为fi ,其算术平均数的计算公式为:
x x f 1f1 x 2f2 x n fn x n n
使用公式计算组数据的算术平均数:
例:对某厂工人的工资整理分组后得到如下资料:
28
工资(元) 1000-2000 2000-3000 3000-4000
在Excel中计算极差的方法有两种: 1、首先对一组数据排序,找出其中的最大值与最小 值,然后利用公式计算极差: 极差=最大值-最小值 2、通过插入MAX函数MIN函数计算极差: 极差=MAX(number1,number2…)-
MIN(number1,number2…)
35
三、标准差和方差
标准差和方差是描述数据离散趋势的最主要、最常用 的方法。它从考察所有数据与算术平均数的总体差距的角 度测度数据的平均离散程度,进而评价平均数对数据代表 性的大小。方差是标准差的平方,实际中更多使用的是
分布的集中趋势,这是一组数据的典型代表值。其中最
常用的有:算术平均数、几何平均数、众数、中位数等。
25
二、算术平均数
(一)非组数据的算术平均数
在实际应用中,算术平均数是使用最广泛的中 心趋势值。根据录入的数据类型及整理的程度不同,
算术平均数可以包括非组数据的算术平均数和组数
据的算术平均数两种形式。 非组数据的算术平均数的计算方法是:将所有 单个数据相加,然后除以数据总数目。设有n个数据, 其算术平均数的计算公式为:
x x 1 x2 xn x n n
26
求非组数据的算术平均数的方法
1、使用SUM函数计算非组数据的算术平均数 2、使用AVERAGE函数计算非组数据的算术平均数
(二)组数据的算术平均数
在实际应用中,用户可能需要பைடு நூலகம்理组数据。组数据 是指根据某种标准将数据划分为各种区间的数据。设有n
22
三、创建数据透视图
数据透视图是数据透视表的图形显示效果,为了更直
观地反映数据透视表的汇总效果,可以让两者配合使用。
当用户创建好数据透视表后,右击数据透视表内任一单元 格,单击“数据透视图”按钮,系统可以直接用数据透视 表生成数据透视图,并自动添加一张工作表(以Chart1命 名)来显示数据透视图。 如果想把数据透视图和数据透视表放在一起,以对照 观察事物的特点,可以右击数据透视图的空白处,然后单 击“位置”,再在 “图表位置” 复选框中选择 “作为其
32
第四节
离散趋势程度的分析
一、离散趋势的测定内容 二、极差 三、标准差和方差 四、利用“数据分析”命令进行描述性分析
33
一、离散趋势的测定内容
测定集中趋势只是数据分析的一个方面,要全面地认 识现象还必须了解现象的离散趋势。因为即使现象的集中 趋势相同,其离散趋势也可能不同,致使其数量特征也不 同,因此,仅仅了解现象的集中趋势是不够的。 离散趋势主要是测定现象总体中各个体之间的数值差 异程度,表现在一个现象总体中各数值与平均数的离差程
度。离散趋势指标的大小可以说明平均数的代表性大小; 可以反映社会经济活动过程的均衡性或稳定性程度;还是 抽样推断和相关分析的重要指标。
测定离散趋势的主要方法有极差、标准差和方差。
34
二、极差
极差也称全距,是一组数据中最大值与最小值的差。 它从数据取值范围的角度描述数据的离散趋势,是测定离 散趋势的最简单的方法。
的数据频数,这里利用数组方式计算。
13
第二种方法:通过“数据分析”命令中的“直
方图”工具实现
(1)首先将各组的上限值输入的工作表中; (2)选择“工具”菜单中的“数据分析”命令,出现数 据分析窗口:
(3) 在“分析工具”选项框中选择“直方图”;
14
(4) 单击“确定”,出现“直方图”复选框:
(5) 在“直方图”复选框的“输入区域”框中输入学生 成绩数据所在单元格地址,在“接收区域”框输入分组
30
三、几何平均数
几何平均数也是反映现象集中趋势的方法。在计算
平均发展速度、平均增长率、平均收益率等指标时,经
常用到几何平均数。尤其是在各种投资项目中,收益率 都是需要计算复利的,用几何平均数能很好地度量其集
中趋势。
几何平均数的计算公式为:
xg
n
x 1x 2 x n
在Excel中可以使用GEOMEAN函数计算几何平均数。
组限所在的单元格地址,在“输出区域”框输入生成的
频数分析表放置的单元格地址,并在下面选中“图表输 出” ;
15
(6) 单击“确定”,出现“频数分布表”和“直方图”
结果。 注意:
(1)在“频数分布表”和“直方图”结果中,“接
收”是指组限,而“频率”实际上是指“频数”。
(2)利用“直方图”工具直接作出的所谓“直方图”
三 定量数据的基本特征分析
(一) 定量数据的频数分析
(二) 利用数据透视表进行分析
(三) 集中趋势程度的分析 (四) 离散趋势程度的分析
1
第一节
定量数据的频数分析
一、定量数据分组
二、单项式数组的频数分析
三、组距式数组的频数分析
2
一、定量数据分组
定量数据的频数分析往往是从数据的分组开始,数据分组
3、单击“下一步”,出现如下的复选框:
18
4、设置数据透视表数据区域; 5、单击“下一步”,出现如下的对话框:
6、选择数据透视表显示位置,然后单击“完成”, 出现如下界面:
19
7、设置具体的透视表数据,按照分析目的将有关的字段 名拖动到相应的标题区域,即完成了数据透视表的创建。
20
21
二、编辑数据透视表
60 50
学生人数(人)
40 30 20 10 0 1 2 3 年龄(岁) 4 5
进一步编辑频数分布图,主要是要将横轴的刻度改为 实际的年龄刻度值;