《统计学》课程实验指导【试验目的】能够使学生在学习统计学原理课程时,掌握统计学中的计算过程,理论联系实际。
由于Excel是目前办公软件中比较流行的软件,因此,本试验课以该软件为基础,实现它的统计计算功能。
通过该试验课程的学习,使每个学生能够达到能够利用该软件的统计计算功能熟练地完成教材中有关例题、习题的计算,并通过案例的学习,培养学生一定的解决实际问题的能力。
【试验内容】Excel中的统计分析功能,包括算术平均数、加权平均数、方差、标准差、协方差、相关系数、统计图形、随机抽样、参数点估计、区间估计、假设检验、方差分析、移动平均、指数平滑、回归分析。
【试验计划】两个教学周,上试验课一次,时间一小时。
【试验地点】学院办公楼二层计算机机房试验一:描述性统计在Excel中的操作程序此分析工具用于生成对输入区域中数据的单变值分析,提供有关数据趋中性和易变性的信息。
(-)“描述统计”对话框输入区域在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
分组方式如果需要指出输入区域中的数据是按行还是按列排列,请单击“逐行”或“逐列”。
标志位于第一行/列如果输入区域的第一行中包含标志项,请选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,请选中“标志位于第一列”复选框;如果输入区域没有标志项,则该复选框不会被选中,Microsoft Excel 将在输出表中生成适宜的数据标志。
平均数置信度如果需要在输出表的某一行中包含均值的置信度,请选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。
例如,数值 95% 可用来计算在显著性水平为 5% 时的均值置信度。
第 K 大值如果需要在输出表的某一行中包含每个区域的数据的第 k 个最大值,请选中择此复选框,然后在右侧的编辑框中,输入 k 的数值。
如果输入 1,则这一行将包含数据集中的最大数值。
第 K 小值如果需要在输出表的某一行中包含每个区域的数据的第 k 个最小值,请选中此复选框,然后在右侧的编辑框中,输入 k 的数值。
如果输入 1,则这一行将包含数据集中的最小数值。
输出区域在此输入对输出表左上角单元格的引用。
此工具将为每个数据集产生两列信息。
左边一列包含统计标志项,右边一列包含统计值。
根据所选择的“分组方式”选项的不同,Microsoft Excel 将为输入表中的每一行或每一列生成一个两列的统计表。
新工作表组单击此选项,可在当前工作簿中插入新工作表,并由新工作表的 A1 单元格开始粘贴计算结果。
如果需要给新工作表命名,请在右侧编辑框中键入名称。
新工作簿单击此选项,可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。
汇总统计如果需要 Microsoft Excel 在输出表中生成下列统计结果,请选中此复选框。
这些统计结果有:平均值、标准误差(相对于平均值)、中值、众数、标准偏差、方差、峰值、偏斜度、极差(全距)、最小值、最大值、总和、总个数、Larges t (#)、Smallest (#) 和置信度。
(二)实例应用:某老师对几名学生的五次考试成绩进行分析,以便对这几个学生在学习方面的问题加以解决。
使用“描述统计”分析工具对其数据进行分析。
(数据文件名:描述统计.xls)操作步骤:1、打开数据“描述统计.xls”。
如下:2、选择“数据分析”对话框中“描述统计”,跳出“描述统计”对话框。
2、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($A$4:$F$8)。
3、单击“逐行”选项。
4、选中“标志位于第一行”选项。
5、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。
如:“描述统计结果”。
6、选中“汇总统计”。
7、选中“平均数置信度”,并在其相应的编辑框中输入“95”。
8、选中“第K大值”和“第K小值”,并在其相应编辑框中输入“1”。
9、单击“确定”。
10、数据输出在新创建的工作表“协方差分析结果”中的“A1:J18”区域。
如下:在数据输出的工作表中,可以看出每个学生的的成绩的各种分析结果。
其中第3行至第18行分别为:平均值、标准误差、中值、标准误差、样本方差、峰值、偏度、最大值、最小值、和、计数、第1大值、第1小值、95%概率保证程度的置信度。
根据“标准偏差”值可以看出王华的成绩离散程度最大,即是说其成绩极不稳定,刘明的成绩是最稳定的。
若取中值进行分析则是王华的成绩最好。
平均值为刘明最佳。
总体上而言,王华的成绩应该是最好的,只是最后一次的成绩太差,造成了较大的影响。
试验二:统计直方图在Excel中的操作程序在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,用于统计有限集中某个数值元素的出现次数。
例如,在一个有 20 名学生的班级里,可以确定以字母打分(如 A、B-等)所得分数的分布情况。
直方图表会给出字母得分的边界,以及在最低边界与当前边界之间某一得分出现的次数。
出现频率最多的某个得分即为数据组中的众数。
“直方图”对话框接收区域(可选)在此输入接收区域的单元格引用,该区域应包含一组可选的用来定义接收区间的边界值。
这些值应当按升序排列。
只要存在的话,Microsoft Excel 将统计在当前边界点和相邻的高值边界点之间的数据点个数。
如果某个数值等于或小于某个边界值,则该值将被归到以该边界值为上限的区间中。
所有小于第一个边界值的数值将一同计数,同样所有大于最后一个边界值的数值也将一同记数。
如果省略此处的接收区域,Microsoft Excel 将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。
柏拉图选中此复选框,可以在输出表中同时按降序排列频率数据。
如果此复选框被清除,Microsoft Excel 将只按升序来排列数据,即省略输出表中最右边的三列数据。
累积百分率选中此复选框,可以在输出表中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。
如果清除此选项,则会省略累积百分比。
图表输出选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。
实例应用:学生历次考试成绩统计,按照一定区间生成频数分布表,使用“直方图”分析工具来完成。
(数据文件名:直方图.xls)操作步骤:1、打开数据“直方图.xls”,如图2、选择“数据分析”对话框中“直方图”,跳出“直方图”对话框。
3、在“输入区域”对应编辑框输入学生成绩数据的引用。
($B$2:$B$15)4、在“接受区域”对应编辑框输入数据划分单元格的引用。
($A$18:$A$22)5、看是否在输入栏里是否选择了标志单元格,考虑选定“标志”。
在输出选项中选择“新工作表组”,在其对应编辑框中输入输出工作表名称,如;“图表输出”。
选择“帕拉图”、“累积百分率”、“图表输出”选项。
5、单击确定。
结果输出如下在图中显示的统计结果中,可以看见输出的内容分为两部分,一部分是数据表示形式,一部分是直方图形式。
在数据表部分,显示每个区间中的人数及累计百分率数值。
通过该统计结果,我们可以知道,在第一次考试中有6人在100~85分之间,5人在85~75之间,1人在75~65之间,1人在65以下。
试验三:协方差和相关系数在Excel中的计算1、协方差此分析工具及其公式用于返回各数据点的一对均值偏差之间的乘积的平均值。
协方差是测量两组数据相关性的量度。
可以使用协方差工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正协方差);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负协方差);还是两个集合中的数据互不相关(协方差为零)。
“协方差”对话框输入区域在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
实例应用:用协方差分析工具分析某公司历史“推销费用”、“销售额”、“营业人员”三项数据之间是否存在相关。
(数据文件名:协方差.xls)操作步骤:1、打开数据“协方差.xls”,如下:2、选择“数据分析”对话框中“协方差”,跳出“协方差”对话框。
3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($B$1:$D$9)。
6、单击“逐列”选项。
7、选中“标志位于第一行”选项。
8、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。
如:“协方差分析结果”。
9、单击“确定”。
10、数据输出在新创建的工作表“协方差分析结果”中的“A1:D4”区域。
如下:在上图所示的输出表为“推销费用”、“营业员”、“销售额”三个变量的协方差矩阵。
明显,对角线上为各自方差;其他,三个变量相互之间协方差分别为:202.125、199.5、610.5,说明三个变量之间存在较显著的相关性,不是相互独立的。
2、相关系数此分析工具及其公式可用于判断两组数据集(可以使用不同的度量单位)之间的关系。
总体相关性计算的返回值为两组数据集的协方差除以它们标准偏差的乘积:可以使用“相关系数”分析工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关性为零)。
“相关系数”对话框输入区域在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
实例应用:对某厂销售额、营业人员、以及推销费用的历史数据进行相关分析。
(数据文件名:相关系数.xls)操作过程:1、打开数据“相关系数.xls”。
如下:2、在数据分析对话框中选择“相关系数”后,跳出“相关系数”对话框。
3、在“输入区域”编辑框中输入三列数据所在的单元格区域引用($B$1:$D$9)。
4、单击“逐列”选项。
5、选中“标志位于第一行”选项。
6、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。
如:“相关分析结果”。
7、单击确定。
8、数据输出在新创建的工作表“相关分析结果”中的“A1:D4”区域。
如下:在上图所示的输出表为“推销费用”、“营业员”、“销售额”三个变量的相关系数矩阵。
明显,对角线上变量与自己完全正相关,值为1;其他,三个变量相互之间相关系数分别为:0.989786、0.993619、0.996674,数值非常接近1,说明三个变量之间存在较显著的相关关系。
试验四: t 统计检验在Excel中的操作程序“分析工具库”中提供了三种工具,可用来检验各种样本总体的均值。
(-)“t - 检验:双样本等方差假设”分析此分析工具可以进行双样本学生氏 t - 检验。
此 t- 检验先假设两个数据集的平均值相等,故也称作齐次方差 t - 检验。
可以使用 t - 检验来确定两个样本均值实际上是否相等。