云南大学数学与统计学实验教学中心
实验报告
一、实验目的
1.熟悉MATLAB的运行环境.
2.学会初步建立数学模型的方法
3.运用回归分析方法来解决问题
二、实验内容
实验一:某公司出口换回成本分析
对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。
试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本.
实验二:某建筑材料公司的销售量因素分析
下表数据是某建筑材料公司去年20个地区的销售量(Y,千方),推销开支、实际帐目数、同类商品
竞争数和地区销售潜力分别是影响建筑材料销售量的因素。
1)试建立回归模型,且分析哪些是主要的影响因素。
2)建立最优回归模型。
提示:建立一个多元线性回归模型。
三、实验环境
Windows 操作系统; MATLAB 7.0.
四、实验过程
实验一:运用回归分析在MATLAB 里实现
输入:x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00 3.40 6.90]'; X=[ones(13,1) x];
Y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40]'; plot(x,Y,'*');
[b,bint,r,rint,stats]=regress(Y,X,0.05); 输出: b = 2.6597 -0.2288
bint = 1.8873 3.4322
-0.3820 -0.0757
stats = 0.4958 10.8168 0.0072 0.0903
即==1,0ˆ6597.2ˆββ,-0.2288,0ˆβ的置信区间为[1.8873 3.4322],1,ˆβ的置信区间为[-0.3820 -0.0757]; 2r =0.4958, F=10.8168, p=0.0072 因P<0.05, 可知回归模型 y=2.6597-0.2288x 成立.
1
1.5
2
2.5
散点图
估计某家公司商品流转费用率是6.5%的出口换汇成本。
将x=6.5代入回归模型中,得到 >> x=6.5;
>> y=2.6597-0.2288*x y =
1.1725
实验二:在MATLAB 里实现, ①首先建立回归模型 输出:
x1=[5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5 8.0 6.0 4.0 7.5 7.0]'; x2=[31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59]'; x3=[10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9]'; x4=[8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11]';
Y=[79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0 201.4 100.2 135.8 223.3 195.0]'; X=[ones(20,1) x1 x2 x3 x4];
[b,bint,r,rint,stats]=regress(Y,X,0.05); b,bint,stats 输出: b = 191.9158 -0.7719 3.1725 -19.6811 -0.4501 bint =
103.1071 280.7245 -7.1445 5.6007 2.0640 4.2809 -25.1651 -14.1972 -3.7284 2.8283 stats =
0.9034 35.0509 0.0000 644.6510
即0ˆβ= 191.9158 1,ˆβ=-0.7719 2ˆβ= 3.1725 3
ˆβ=-19.6811 4ˆβ=-0.4501; 0ˆβ的置信区间为[103.1071 280.7245];1,ˆβ的置信区间为[-7.1445 5.6007];2ˆβ的置信区间为[2.0640 4.2809];3
ˆβ的置信区间为[-25.1651 -14.1972];4ˆβ的置信区间为[-3.7284 2.8283]; 2r = 0.9034, F=35.0509, p=0.0000
因P<0.05, 可知回归模型 y=191.9158 -0.7719x1+3.1725*x2-19.6811*x3 -0.4501*x4成立. ②分析哪些是主要的影响因素
输入:x1=[5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5 8.0 6.0 4.0 7.5 7.0]'; x2=[31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59]'; x3=[10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9]'; x4=[8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11]';
Y=[79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0
201.4 100.2 135.8 223.3 195.0]'; X=[x1 x2 x3 x4]; stepwise(X,Y);
X 1
X 2X 3X 4
Coefficients with Error Bars
1
Model History
R M S E
从表Stepwise Table 中分析得出变量x2和x3为主要的影响因素。
-25
-20
-15
-10
-5
5
X 1
X 2X 3X 4
Coefficients with Error Bars
1
2
3
Model History
R M S E
③移去非关键变量x1和x4后模型具有显著性.虽然剩余标准差(RMSE)都有了变化,统计量F的值明显增大,因此新的回归模型更好.就得到最优模型。
输入:
X1=[ones(20,1) x2 x3];
[b,bint,r,rint,stats]=regress(Y,X1);
b,bint,stats
输出:
b =
186.0484
3.0907
-19.5140
bint =
110.4254 261.6715
2.1657 4.0156
-24.5597 -14.4683
stats =
0.9024 78.6295 0.0000 574.1580
P=0.0000<0.05,说明回归模型的回归效果显著;
最优回归方程为:y=186.0484+3.0907*x2-19.5140*x3
五、实验总结
1.遇到的问题及解决过程
2.产生的错误及原因分析
3.体会和收获
六、参考文献
[1]数学实验,重庆大学数学系傅鹂、龚劬、刘琼荪、何中市编著,科学出版社,2000年9月.
七、教师评语。