当前位置:文档之家› 数学建模实验报告-统计回归模型

数学建模实验报告-统计回归模型


二. 建立公司销售额对全行业的回归模型, 并用 DW 检验诊断随机误差项的 自相关性。
1.模型求解结果:
2
b= -1.4548 0.1763 bint = -1.9047 -1.0048 0.1732 0.1793 stats = 1.0e+004 * 0.0001 1.4888
0
0.0000
Residual Case Order Plot
%自相关性检验 Y=b0(1)+b0(2).*x0; Et=y0-Y; figure %模型残差
dw1=sum((Et(2:19,1)-Et(1:18,1)).^2); dw2=sum((Et(2:19,1)).^2); DW0=dw1/dw2
三. 建立消除了随机误差项自相关性之后的回归模型
1.广义差分变换 原模型: yt 0 1 xt t , t t 1 ut 变换:
《数学建模与数学实验》实验报告
实验 2
专业、班级 课程编号 实验(上机)地点 任课教师 学号 实验类型 教七楼数学实验中心 验证性 完成时间 评分
统计回归模型
姓名 学时 2
一、实验目的及要求
1.掌握数学软件 Matlab,c++的基本用法和一些常用的规则,能用该软件进行编程; 2.能够借助数学软件进行统计回归数学模型问题的求解和分析; 3.理解统计回归数学模型的数学原理,并能够分别利用统计回归数学模型进行实际问题的建模。

DW
e
t 2
n
t
et 1 2
2 t
e
t 2
n
21
e e
t 2 n
n
t t 1
e
t 2
2 t
2 1
做矩阵运算(减法、乘法等)求得 DW 值。其中求和号可用函数 sum。
-0.1104
5
0.1691 stats1 = 1.0e+003 * 0.0010
0.1829
2.9374
0
0.0000
Residual Case Order Plot
0.2 0.15 0.1 0.05 0 -0.05 -0.1 -0.15 -0.2 2 4 6 8 10 Case Number 12 14 16 18
结果分析: y 的 100%可由模型确定, F=16752 远超过 F 检验的临界值, p 远小于 0.05 ,
0 , 1 的置信区间 bint 不包含零点,数据点的残差置信区间 rint 均包含零点,所以模型
4
yt -1.6093 0.1773xt ,从整体上看成立。
3.自相关性的定量诊断——DW 检验
结果分析: y 的 100%可由模型确定, F=2937.4 远超过 F 检验的临界值, p 远小于 0.05 ,
* 0 , 1 的置信区间不包含零点,但从图中看出,第 12 个点的残差的置信区间不包含零
点,应作为异常去掉。 代码:
%新模型求解 X1=[ones(18,1) x1]; [b1,bint1,r1,rint1,stats1]=regress(y1,X1); b1,bint1,stats1,rcoplot(r1,rint1)
2.广义差分法
关键是通过变换 yt* yt yt 1 , xt* xt xt 1 1 DW 得到新模型。 2
四、参考文献
[1] 姜启源,谢金星,叶俊.数学模型(第三版) ,高等教育出版社,2003 [2]邓薇.MATLAB 函数速查手册,人民邮电出版社,2010 DW 检验表
3.新模型的自相关性检验定量诊断——DW 检验
由 DW 值的大小确定自相关性:查 D-W 分布表,得到检验水平 0.05 ,样本容量 n=18,回归变 量数目 k=2 时,对应的检验临界值: d L 1.16, dU 1.39 。 因为结果求得 1.39 dU DW1 1.6537 4 - dU 2.61 ,所以新模型无自相关。
代码:
%新模型自相关性检验 Y1=b1(1)+b1(2).*x1;
6
Residuals
Et1=y1-Y1; %模型残差 Y1(:,1)=b1(1)+b1(2).*x1(:,1); Et1(:,1)=y1(:,1)-Y1(:,1); %模型残差 dw3=sum((Et1(2:18,1)-Et1(1:17,1)).^2); dw4=sum((Et1(2:18,1)).^2); DW1=dw3/dw4
7
由 DW 值的大小确定自相关性: 查 D-W 分布表, 得到检验水平 0.05 ,样本容量 n=19, 回归变量数目 k=2 时,对应的检验临界值: d L 1.18, dU 1.40 。 因为结果求得 DW 0 0.6412 d L 1.18 ,所以该模型存在正自相关。 代码:
yt* yt yt 1 , xt* xt xt 1
* * 新模型: yt* 0 1 xt* ut , 0 0 1


* * (新模型是以 0 , 1 为回归系数的普通回归模型,由数据 yt* , xt* 可估计系数 0 , 1 )
二、借助数学软件,研究、解答以下问题
某公司想用全行业的销售额作为自变量来预测公司的销售量,表中给出了 1977—1981 年公 司的销售额和行业销售额的分季度数据(单位:百万元) (1) 画出数据的散点图,观察用线性回归模型拟合是否合适。 (2) 建立公司销售额对全行业的回归模型,并用 DW 检验诊断随机误差项的自相关性。 (3) 建立消除了随机误差项自相关性之后的回归模型 年 1977 季 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 公司销售额 y 20.96 21.40 21.96 21.52 22.39 22.76 23.48 23.66 24.10 24.01 24.54 24.30 25.00 25.64 26.36 26.98 27.52 27.78 28.24 28.78 行业销售额 x 127.3 130.0 132.7 129.4 135.0 137.1 141.2 142.8 145.5 145.3 148.3 146.4 150.2 153.1 157.3 160.7 164.2 165.6 168.7 171.7
4.消除了随机误差项自相关性之后的回归模型:
yt 0.3948 0.1305yt 1 0.1738xt 0.1096xt 1

三、本次实验的难点分析 1.DW 检验——DW 的求解
(1)难点:DW 的求解不仅涉及模型残差,而且计算公式复杂,需要掌握数组及矩阵的相关运算, 并使用 FOR-END 循环。 (2)解决:先利用已求得的回归系数 0 , 1 写出模型,以此得估计值 y t ;然后做数组减法 y t y t 得 e t ,最后由以下公式:
170
175
代码:
x=[127.3,130.0,132.7,129.4,135.0,137.1,141.2,142.8,145.5,145.3,... 148.3,146.4,150.2,153.1,157.3,160.7,164.2,165.6,168.7,171.7]'; y=[20.96,21.40,21.96,21.52,22.39,22.76,23.48,23.66,24.10,24.01,... 24.54,24.30,25.00,25.64,26.36,26.98,27.52,27.78,28.24,28.78]'; plot(x,y,'.') title('数据散点图') xlabel('行业销售额 x'); ylabel('公司销售额 y')
0.3
0.2
0.1
Residuals
0
-0.1
-0.2
-0.3 2 4 6 8 10 12 Case Number 14 16 18 20
结果分析: y 的 100%可由模型确定, F=14888 远超过 F 检验的临界值, p 远小于 0.05 ,
0 , 1 的置信区间 bint 不包含零点,但是,从图中可以看出,第 4 个点的残差的置信区
1978
1979
1980
1981
1
一.画数据的散点图如下,观察发现用线性回归模型 yt 0 1 xt t 拟合 比较合适。
数据散点图 29 28 27 26
公司销售额y
25 24 23 22 21 20 125
130
135
140
145 150 155 行业销售额x
160
165
间 rint 不包含零点,应作为异常点去掉。 代码:
figure %模型求解 X=[ones(20,1) x]; [b,bint,r,rint,stats]=regress(y,X); b,bint,stats,rcoplot(r,rint)
2.去掉第 4 个异常点后的模型求解 结果:
3
b0 = -1.6093 0.1773 bint0 = -2.0403 -1.1783 0.1744 0.1802 stats0 = 1.0e+004 * 0.0001 1.6752
代码:
%广义差分变换 low=1-DW0/2; x1=zeros(18,1); y1=zeros(18,1); for t=2:19 y1(t-1,1)=y0(t)-low*y0(t-1); x1(t-1,1)=x0(t)-low*x0(t-1); end
2.新模型求解结果:
相关主题