当前位置:文档之家› 统计实验报告

统计实验报告

山东工商学院学生实验报告
《统计学》
实验报告
实验项目:数据整理实验
实验地点:商学实验中心实验室名称: 109
学院:经济学院年级专业班:金融134 学生姓名:王尚学号: 13015419
完成时间: 15-16周
教师评语:
开课时间: 2014 至 2015 学年第 2 学期
一、实验目的
对数据进行分组整理,得到频数分布表,并选择合适的图形展示其数据分布的特征;
绘制直方图、柱状图、饼图、环形图、散点图、线图、雷达图。

二、实验环境
Excel 2003软件
三、实验数据来源
本院国商专业学生信息采集
四、实验步骤、结果及相关的分析
从数据中抽取40样本,点击数据分析中的直方图,将样本身高数据作为输入区域,身高上限列作为接受区域,随机空白单元格为输出区域,点击确定。

由频率分布表即可得到样本身高分布柱形图、折线图、直方图、雷达图、饼图、散点图和环形图。

24681012人数
人数
实验结论
通过对这40个样本数据的身高分析,绘制出了柱形图、折线图等直观反映出总体身高数据情况,从图中可以看出身高在165-170的人数最多,身高大多集中在160-165,165-170,身高最小值为150,最大值为186,极差为36。

从折线图我们可以看到,身高在160-170的人数分布相对集中,两边分布的较少。

山东工商学院学生实验报告
《统计学》
实验报告
实验项目:数据分布特征实验
实验地点:商学实验中心实验室名称: 109
学院:经济学院年级专业班:金融134 学生姓名:王尚学号: 13015419
完成时间: 15-16周
教师评语:
开课时间: 2014 至 2015 学年第 2 学期
一、实验目的
分别用数据分析模块和Excal函数计算未分组及分组数据的各种描述统计量
二、实验环境
Excal 2003环境
三、实验资料
国际商务专业学生信息采集
四、实验步骤、结果及相关分析
(一)分别计算总体和样本数据身高描述统计量。

运用“描述统计”工具进行数据描述
“描述统计”工具可以生成以下统计指标,按从上到下的顺
序为:平均值、标准误差、中位数、众数、样本标准差、样
本方差、峰度值、偏度值、级差、最小值、最大值、样本总
和、样本个数和一定显著水平下总体均值的置信区间。

将总体数据和40个已经抽样后的样本数据的编号和身高两列分别复制到新表。

点击工具—数据分析—描述统计---确定
在输出区域中选中总体数据身高一列,标志位于第一行,输出区域选择任意空白单元格,勾选汇总统计,点击确定,即可得到总体样本身高的所有描述统计量。

同理可得到样本身高数据的所有描述统计量。

(二)运用函数法进行统计描述
常用的统计函数
函数名称函数功能
=Average()计算指定序列算数平均数=Median()计算给定数据集合的中位数=Mode()计算给定数据集合的众数=MAX()计算最大值
=Min()计算最小值
=Quartile()计算四分位点
=Stdev()计算样本的标准差
=Stdevp()计算总体的标准差
=Var()计算样本的方差
=Varp()计算总体的方差
实验结论:
平均数反应总体各单位数据水平的综合指标,从描述统计量来看,样本平均数为166.8,总体样本平均数为165.2,两值相差不大,进而可以用样本数据推测总体。

众数椒指总体中出现次数最多的数据,样本数据众数为168,说明样本中出现次数最多的数据为168。

中位数是将各单位的标志值按2大小顺序进行排列后,处于中间位置的标志值。

样本数据中位数为167,说明中间位置的数为167.样本数据最大值为186,最小值为150,极差为36。

方差椒各单位标志值与其算术平均数离差平方的平均数,标准差是各个单位标志值与其算术平均数离差平方的平均数的平方根,样本数据的方差是64.1,标准差是8.0,而总体的方差椒51.6,标准差椒7.2,可见用样本估计总体还是会有一定差距,因为样本数据本身会因为抽样问题而抽出一些极端值的数据是总体推测时不是很准确。

偏度是对分布偏斜方向及程度的度量,样本的偏度0.434539,偏度>0,所以整体右偏。

峰度是用来衡量分布的集中程度或分布曲线的尖峭程度的指标,样本的峰度是0.366473,峰度大于0表示样本数据分布与正态分布相比较为陡峭,进而可推测总体也会较为陡峭。

山东工商学院学生实验报告
《统计学》
实验报告
实验项目:相关回归分析
实验地点:商学实验中心实验室名称: 109
学院:经济学院年级专业班:金融134 学生姓名:王尚学号: 13015419
完成时间: 15-16周
教师评语:
开课时间: 2014 至 2015 学年第 2 学期
一、实验目的
相关分析:绘制散点图,观测两变量之间关系;
计算相关系数,分析相关程度
回归分析:构建线性回归方程,进行检测
二、实验环境
Excal2003环境
三、实验资料
全国11省市人均GDP指数及人均消费水平
——国家统计局网
四、实验步骤、结果及相关的分析
(一)绘制散点图:选定人均GDP作自变量,人均消费水平数据区域,插入-图表-散点图
关系形态:正线性相关,说明人均GDP越高,人均消费水平越高。

(二)计算相关系数,并说明两个变量之间的关系程度:工具-数据分析-相关系数
关系程度:从相关矩阵可以看出,人均国内生产总值与人均消费水平相关程度高度相关
(三)求出估计的回归方程:工具-数据分析-回归
回归方程:x
y 297.071.724ˆ+=
实验结论:=0
ˆβ724.71表示人均GDP 每增加1时,人均消费水平将
平均增加724.71; 297.0ˆ1=β表示即使在人均
GDP 为0的情况下,人均
消费水平平均也有0.297 计算判定系数
2R =0.959696705
实验结论:该系数表明在人均消费水平的变动中,有95.97%是由人均GDP 决定的。

可见人均消费水平与人均GDP 之间有较强的线性关系,回归直线的拟合程度很高。

(四)检验回归方程线性关系的显著性 (a=0.05) 提出假设:0H : 1β=0 1H : 1β≠0 计算检验统计量F : F=214.3068
作出决策:根据显著性水平α=0.05,自由度df=9,得到相应的临界值2/αt =7.21 <14.639,所以不拒绝0H
如果某地区的人均GDP 为5000元,预测其人均消费水平 y=724.71+0.297*5000=2209.71
求人均GDP 为5000元时,人均消费水平95%的置信区间
2209.71±1.39
置信区间[2208.32,2211.1]
山东工商学院学生实验报告
《统计学》
实验报告
实验项目:时间序列实验
实验地点:商学实验中心实验室名称: 109
学院:经济学院年级专业班:金融134 学生姓名:王尚学号: 13015419
完成时间: 15—16周
教师评语:
开课时间: 2014 至 2015 学年第 2 学期
一、实验目的
计算移动平均数和指数平滑值,并进行预测
二、实验环境
Excal2003环境
三、实验资料
1986-2000年居民消费价格指数
—国家统计局网
四、实验步骤、结果及相关的分析
(一)对居民消费价格指数做三期移动平均分析。

在居民消费价格指数表格中进行操作:点击工具,点击数据分析,点击移动平均,点击确定。

在输入区域中选择居民消费价格指数一列,间隔为3,输出区域为价格指数旁边空白单元格,勾选图标输出,点击确定,即可显示出三期移动平均值。

3期移动平均数
110.9 114.7
113.3 108.2 104.3 108.2 115.1 118.6 116.5 109.4 103.4 100.2 99.4
复制三期移动平均数一列后,在旁边右击选择性粘贴,点击数值,点击确定,即可得到三期移动预测值。

计算出居民消费价格指数和3期移动平均预测值的差值,再计算出差值的平方,加总后再开方算出方差。

3期移动预
测值
110.9
114.70
113.30
实验结论:
移动平均法对原时间序列具有修匀或平滑的作用,使得原序列的起伏波动被削弱了,从图中的实际值和预测值来看,预测值的三期移动平均曲线要比实际值的平滑一些,起伏波动也较小,所以证明胃移动平
均法对原时间序列有平滑作用。

(二)对居民消费价格指数做指数平滑分析。

计算出af=0.2指数平滑预测值
点击工具—数据分析—指数平滑—确定。

在指数平滑中的输入区域中选择价格指数一列,阻尼系数为0.8,输出区域选择旁边单元格,勾选图表输出,点击确定即可显示指数平滑值和图表。

用居民消费价格指数的实际值减去af=0.2指数平滑预测值得到的差值,将差值平方后加和后再取平均值后再开方得到8.36199198。

实验结论:
我们从三期移动平均和指数平滑得到的居民消费指数的两条曲线的对比图像中可以直观的看出,指数平滑做出的居民消费指数更加平滑,预测值也比三期移动平均值更加准确,另一方面,从数据上来看,我们计算分别得到了三期移动平均和指数平滑的实际值和预测值相差后加总计算的方差中,三期移动平均得到的是9.46330628,而指数平滑得到的是8.36199198,显然也是指数平滑的方差较小,也可以说明指数平滑的预测曲线更平滑,更贴近实际数据。

相关主题