当前位置:文档之家› 实验13回归分析报告报告材料

实验13回归分析报告报告材料

实验13 回归分析
【实验目的】
1. 了解回归分析的基本原理,掌握MATLAB 实现的方法;
2. 练习用回归分析解决实际问题。

【实验内容】 【题目2】
电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表), 建立回归模型并进行检验,诊断异常点的存在并进行处理。

2.1 模型分析
本题研究电视广告费用与报纸广告费用对电影收入的影响。

我们首先尝试线性回归,由R 2 值判断回归模型是否合理。

如果不合理, 再采取其他方法进行回归分析。

设电视广告费用为1x ,报纸广告费用为2x ,每周电影院收入为y 。

建立如下模型:
22110x x y βββ++=
2.2 matlab 求解
得到如下结果:
整理成表格如下:
在残差及置信区间的图中,第一个点的残差的置信区间不包含零点,以红色标出。

残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。

2.3 剔除点后重新计算
删除第一个点后重新计算,将输出结果同样以表格表示。

剔除第一个异常点后,R2=0.97685,相比之前有了增加,拟合的线性性有了提高;相比之前的模型,p值也有了明显的减少,远小于显著性水平α,这表示置信概率大大提高了;s2 也有了减小,说明了偏差减小。

综合以上几点,说明这个二元线性的模型比较合理,回归效果很好。

拟合公式为y=81.4881+1.2877x1+2.9766x2
2.4 小结
本题是个较为直观的线性回归题,在它的计算中出现了异常点。

剔除后计算可以得到一个回归效果相当好的模型。

【题目8】
汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华
型)18个月的调查资料如表,其中y
1是普通型汽车售量(千辆),y
2
是豪华型汽车售量(千
辆),x1是汽油价格(元/gal),x2是贷款利率(%)
(1)对普通型和豪华型汽车分别建立如下模型:
y 1=β
(1)

1
(1)
x1+β
2
(1)
x2,y
2

(2)

1
(2)
x1+β
2
(2)
x2
给出β的估计值和置信区间,决定系数R2,F值及剩余方差等。

(2)用x3=0,1表示汽车类型,建立统一模型y=β
0+β
1
x1+β
2
x2+β
3
x3,给出给出β的
估计值和置信区间,决定系数R2,F值及剩余方差等。

以x3=0,1带入统一模型,将结果与(1)的两个模型的结果比较,解释二者的区别。

(3)对统一模型就每种类型汽车分别作x1和x2与残差的散点图,有什么现象,说明模型有何缺陷?
(4)对统一模型增加二次项和交互相,考察结果有什么改进。

8.1 根据模型分别求解
由题意,对普通型和豪华型汽车分别建立如下模型:
y 1=β
(1)

1
(1)
x1+β
2
(1)
x2,y
2

(2)

1
(2)
x1+β
2
(2)
x2
此为二元线性回归,可用matlab编写程序如下:
得到如下图:
在残差及置信区间的图中,有三个点的残差的置信区间不包含零点,以红色标出。

残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。

8.2 剔除点后的模型求解
(1)对于y
1=β
(1)

1
(1)
x1+β
2
(1)
x2
剔除第14、18个点后
继续自此基础上剔除第11个点
(2)对于y
2=β
(2)

1
(2)
x1+β
2
(2)
x2
剔除第14个点后
继续剔除第七个点,得到残差及置信区间图如下:
将输出结果汇总成下表:
可得模型如下:
普通型:y=107.5601-37.9283x1-3.0314x2豪华型:y=29.7583-6.7738x1-1.6367x2
8.3 建立统一模型
建立统一模型y=β
0+β
1
x1+β
2
x2+β
3
x3,用x3=0表示普通型,x3=1表示豪华型,
此时为三元线性回归,可用matlab编写程序如下:
输出如下结果:
可得模型为:y=64.5753−16.1436−2.3322x2−14.4222x3,x3=0表示普通型,x3=1表示豪华型。

即:
普通型:y=64.5753−16.1436−2.3322x2
豪华型:y=50.1531−16.1436−2.3322x2
可以看出:统一模型相当于将分立模型进行了统一:
(1)统一模型的β值趋近于给分立模型的“平均”;
(2)统一模型的残差较大;
(3)统一模型的决定系数较小;
(4)统一模型的拒绝概率较小,到达了10的-12次方量级,说明模型更加有效;
总体上讲,将两者统一后进行回归分析的结果有其优点,但是仍有许多不理想的成分。

8.4 就每种类型汽车分别作x1和x2与残差的散点图
得到如下图形
对比以上各图,发现针对同一变量(x1或x2),两种类型汽车所得的残差变化趋势不一致,说明x1、x2与x3有交互作用,即模型的缺陷是缺少二次项和交互项。

8.5 对统一模型增加二次项和交互相进行回归
(1)增加交互项,改用模型:
y=β
0+β
1
x1+β
2
x2+β
3
x3+β
4
x1x2+β
5
x2x3+β
6
x
3
x1
进行回归分析
得到如下结果:
发现R2、F和s2都有所改善,模型有效的概率也有所提高,但是x1,x2的置信区间都包含0,这应当是由于引入交互项x1x3和x2x3导致的。

(2)增加二次项
改用模型:
y=β
0+β
1
x1+β
2
x2+β
3
x3+β
4
x12+β
5
x22
这里不增加x32是因为它和x3一样。

将程序改为
得到如下结果:
发现x1*x1的置信区间仍包含0点。

(3)综合
综合以上分析,建立如下模型:
y=β
0+β
1
x1+β
2
x2+β
3
x3+β
4
x1x3+β
5
x2x3+β
6
x22
将程序改为
输出结果如下:
拒绝模型的概率达到10的-15次方。

模型如下:
y=25.2153+17.5089x1−0.3020x2−28.2975x3−4.2510x1x3+2.2850x2x3 +0.3184x22
【实验总结】
这是本学期数学实验的最后一次作业,总体来说比较顺利。

这部分内容综合了之前学习过的优化以及统计推断的内容,是综合性较强的一部分,很好地帮助我复习了以前学习过的内容。

收获简要总结如下:
1、学习了回归分析相关知识,包括一元线性回归、多元线性回归以及非线性回归;
2、了解了残差分析、交互作用等内容;
3、学习了使用MATLAB进行回归分析的方法;。

相关主题