当前位置:
文档之家› matlab多元线性回归与逐步回归实验1
matlab多元线性回归与逐步回归实验1
选取1989—2003年的全国的统计数据,考虑的自变量包括:工业总产值 ,农业总产值 ,建筑业总产值 ,社会商品零售总额 ,全民人口数 ,受灾面积 ,国家财政收入 ,单位均为亿元。数据见表3.17。
表11989至2003 年统计数据
年份
x1
x2
x3
x4
x5
x6
y
1989
6484.00
4100.60
794.00
5218.10
1995
24718.30
11884.60
3Байду номын сангаас19.60
20620.00
121121.0
45821.00
6242.20
1996
29082.60
13539.80
4530.50
24774.10
122389.0
46989.00
7407.99
1997
32412.10
13852.50
4810.60
5588.00
1415.00
10993.70
117171.0
51333.00
3483.37
1993
14143.80
6605.10
2284.70
12462.10
118517.0
48829.00
4348.95
1994
19359.60
9169.20
3012.60
16264.70
119850.0
55043.00
6858.00 4954.30859.40 8300.10 114333.038474.00 2937.10;
8087.105146.401015.109415.60115823.055472.003149.48;
10284.505588.001415.0010993.70117171.051333.003483.37;
表2 的最小二乘估计
变量
值
-6922.6
0.1
-0.9
0
0.6
0.1
0
表3方差分析表
方差来源
平方和
自由度
均方和
F
p
回归
5.2695e+008
6
7.5278e+007
465.4205
0
误差
1.1322e+006
8
1.6174e+005
总计
5.2808e+008
14
检验: 不全为0
由表2可知,统计量 ,在显著性水平 ,查 分布表,得临界值 。由 ,所以拒绝 ,接受备择假设。则总体回归系数不全为0,即表明模型的线性关系在95%的置信水平下显著成立。
14143.806605.102284.7012462.10118517.048829.004348.95;
19359.609169.203012.6016264.70119850.055043.005218.10;
24718.3011884.603819.6020620.00121121.045821.006242.20;
47119.00
18903.64
2003
53092.90
14870.10
8181.30
45842.00
129227.0
54506.00
21715.25
(1)建立多元回归模型;
(2)用逐步回归求国家财政收入 与6个因素的回归关系.
、实验程序:
程序1
clear,clc
A=[6484.00 4100.60 794.00 8101.40 112704.0 46991.00 2664.90;
ESS=y'*(eye(n)-H)*y%计算ESS
RSS=y'*(H-1/n*ones(n,n))*y%计算RSS
MRS=RSS/p%计算MRS
MSE=ESS/(n-p-1)%计算MSE
%F检验
F0=(RSS/p)/(ESS/(n-p-1))%计算F0
程序2:
X=[A(:,1),A(:,2),A(:,3),A(:,4),A(:,5),A(:,6)];
27298.90
123626.0
53429.00
8651.14
1998
33387.90
14241.90
5231.40
29152.50
124761.0
50145.00
9875.95
1999
35087.20
14106.20
5470.60
31134.70
125786.0
49981.00
11444.08
2000
《模糊数学》实验报告
实验名称:多元线性回归与逐步回归
实
验
目
的
1.熟练掌握现行回归模型的建模方法,掌握regress命令的使用方法。
2.掌握编程求总离差平方和TSS、回归平方和RSS、残差平方和ESS等相关统计量。
3.掌握逐步回归的思想与方法,掌握stepwise命令的使用方法。
实验主要内容
(具体题目、解答过程及程序)
xlabel('x1(工业总产值)')
ylabel('y(国家财政收入)')
subplot(3,2,2),plot(A(:,2),A(:,7),'*')
xlabel('x2(农业总产值)')
ylabel('y(国家财政收入)')
subplot(3,2,3),plot(A(:,3),A(:,7),'o')
45975.2014931.507005.0042027.10128453.047119.0018903.64;
53092.9014870.108181.3045842.00129227.054506.0021715.25];%自变量数据
[m,n]=size(A);
subplot(3,2,1),plot(A(:,1),A(:,7),'+')
8101.40
112704.0
46991.00
2664.90
1990
6858.00
4954.30
859.40
8300.10
114333.0
38474.00
2937.10
1991
8087.10
5146.40
1015.10
9415.60
115823.0
55472.00
3149.48
1992
10284.50
stepwise(X,y,[1,2,3,4,5,6],0.05,0.10)
%in=[1,2,3,4,5,6]表示x1、x2、x3、x4、x5、x6均保留在模型中
、实验结果与分析:
多元回归模型
运行程序可得到国家财政收入与各因素的散点图(见图1)。
图1国家财政收入与各因素的散点图
得到 的最小二乘估计(见表2)及方差分析表(见表3):
xlabel('x3(建筑业总产值)')
ylabel('y(国家财政收入)')
subplot(3,2,4),plot(A(:,4),A(:,7),'+')
xlabel('x4(社会商品零售总额)')
ylabel('y(国家财政收入)')
subplot(3,2,5),plot(A(:,5),A(:,7),'*')
逐步回归
图2国家财政收入与各因素的散点图
图3国家财政收入与各因素的散点图
由图2至图3:点击all step至出现move to no more。得到回归方程:
其中,蓝色行是被保留的有效行,红色行代表被踢出的变量。
图3中显示了模型参数 ,修正的 , ,与显著性概率相关的 。以上指标值都很好,说明回归效果比较理想。
29082.6013539.804530.5024774.10122389.046989.007407.99;
32412.1013852.504810.6027298.90123626.053429.008651.14;
33387.9014241.905231.4029152.50124761.050145.009875.95;
xlabel('x5(全民人口数)')
ylabel('y(国家财政收入)')
subplot(3,2,6),plot(A(:,6),A(:,7),'o')
xlabel('x6(受灾面积)')
ylabel('y(国家财政收入)')
x=[ones(m,1),A(:,1),A(:,2),A(:,3),A(:,4),A(:,5),A(:,6)];%构造设计矩阵
y=A(:,7);
[n,p]=size(x);%矩阵x0的行数即样本容量
[db,dbint,dr,drint,dstats]=regress(y,x)%调用多元回归分析命令
TSS=y'*(eye(n)-1/n*ones(n,n))*y%计算TSS
H=x*inv((x'*x))*x';%计算对称幂等矩阵
39047.30
13873.60
5888.00
34152.60
126743.0
54688.00
13395.23
2001
42374.60
14462.80
6375.40
37595.20
127627.0
52215.00
16386.04
2002