当前位置：文档之家› 数据模型与决策课程大作业

数据模型与决策课程大作业

数据模型与决策课程大作业
以我国汽油消费量为因变量，乘用车销量、城镇化率和90#汽油吨价与城镇居民人均可支配收入的比值为自变量时行回归（数据为年度时间序列数据）。

试根据得到部分输出结果，回答下列问题：1）“模型汇总表”中的R方和标准估计的误差是多少
2）写出此回归分析所对应的方程；
3）将三个自变量对汽油消费量的影响程度进行说明；
4）对回归分析结果进行分析和评价，指出其中存在的问题。

1）“模型汇总表”中的R方和标准估计的误差是多少
答案：R方为^2= ；标准估计的误差为^（）=
2）写出此回归分析所对应的方程；
答案：假设汽油消费量为Y，乘用车销量为a，城镇化率为b，90#汽油吨价/城镇居民人均可支配收入为c,则回归方程为：
Y=++）将三个自变量对汽油消费量的影响程度进行说明；
乘用车销量对汽油消费量相关系数只有，数值太小，几乎没有影响，但是城镇化率对汽油消费量相关系数是，具有明显正相关，当城镇化率每提高1，汽油消费量增加。

乘用90#汽油吨价/城镇居民人均可支配收入相关系数为，呈明显负相关，即乘用90#汽油吨价/城镇居民人均可支配收入每增加1个单位，汽油消费量降低个单位。

a, b, c三个自变量的sig值为、、，在显着性水平情形下，乘用车消费量对
汽油消费量的影响显着为正。

（4）对回归分析结果进行分析和评价，指出其中存在的问题。

在学习完本课程之后，我们可以统计方法为特征的不确定性决策、以运筹方法为特征的策略的基本原理和一般方法为基础，结合抽样、参数估计、假设分析、回归分析等知识对我国汽油消费量影响因素进行了模拟回归，并运用软件计算出回归结果，故根据回归结果，对具体回归方程，回归准确性，自变量影响展开分析。

Anova表中，sig值是t统计量对应的概率值，所以t和sig两者是等效的，sig要小于给定的显着性水平，越接近于0越好。

F是检验方程显着性的统计量，是平均的回归平方和平均剩余平方和之比，越大越好。

在图表中，回归模型统计值F=，p值为，因此证明回归模型有统计学意义，表现回归极显着。

即因变量与三个自变量之间存在线性关系。

系数表中，除了常数项系数显着性水平大于，不影响，其它项系数都是，小于，即每个回归系数均具有意义。

当然，这其中也存在一定的问题：
在模型设计中，乘用车销量为、城镇化率为、90#汽油吨价/城镇居民人均可支配收入为三个自变量的单位均不同，因此会造成自变量前面的回归系数不具有准确的宏观意义，因此需要对模型进行实现标准化，也就是引入β系数，消除偏回归系数带来的数量单位影响。

根据共线性统计量中的变量的容差t和方差膨胀因子（VIF），自变量间存在共性问题，容差和膨胀因子为倒数关系，容差越小，膨胀因子越大，尤其是城镇化率VIF为，说明共线性明显，可能原因是由于样本容量太小，也可能是城镇化之后乘用车销售量和、90#汽油吨价/城镇居民人均可支配收入本身就具有相关性。

缺乏模型异方差检验。

在多元回归模型中，由于数据质量原因、模型设定原因，异方差的存在会使回归系数估计结果误差较多，所以在建立模型分析的过程红要对异方差进行检验。

数据模型与决策使我们学会使用科学的分析和决策，对经营管理活动实现合理化、精细化、科学化，从而避免了盲目的生产活动。

通过数据预测、假设检验、公式、分析、验证等一系列的步骤，将数据结果逐一展现。

为我们的学习和工作提供了一些非常有用、便捷的，处理问题的方法。

附表：t分布表：
单尾检验的显着水平
df
双尾检验的显着水平
3 4 5 6 7 8 9 10 11 12 13。

e商务文档

数据模型与决策课程大作业

相关文档推荐：