R语言(多元回归)1
最终结果,回归系数检验每一个变量都非常显著,且回归方程的显著性也通过。并且残差的平方和有原来的86.17下降为79.6,有了一定的改善。
4、回归诊断
对残差进行分析
> res2<-residuals(mul_step)
> par(mfrow=c(1,2))
> plot(Y,res2);qqnorm(res2)
>由系数的显著性可以知道,X4有较强的显著性,回归系数显著性检验通过,但其他变量去不行,尽管有回归方程的P值知道回归方程也不显著,需要做进一步的分析。
2、利用逐步回归法进行更进一步的回归工作。
> mul_step<-step(mul_re)
Start: AIC=183.16
Y ~ 1 + X1 + X2 + X3 + X4 + X5
Residual standard error: 86.27 on 14 degrees of freedom
Multiple R-squared: 0.4997, Adjusted R-squared: 0.321
F-statistic: 2.796 on 5 and 14 DF, p-value: 0.05913
> mul_re<-lm(Y~1+X1+X2+X3+X4+X5) #establish the multiple regression model
> summary(mul_re)
Call:
lm(formula = Y ~ 1 + X1 + X2 + X3 + X4 + X5)
Residuals:
Min 1Q Median 3Q Max
利用一下数据对电池的失效周期的影响因素进行分析,选出最优的变量子集
充电率
X1
放电率X2
放电深度X3
温度X4
充电电压极限X5
失效周期Y
0.375
3.13
60
40
2
101
1
3.13
76.8
30
1.99
141
1
3.13
60
20
2
96
1
3.13
60
20
1.98
125
1.625
3.13
43.2
10
2.01
43
Residual standard error: 79.6 on 18 degrees of freedom
Multiple R-squared: 0.4523, Adjusted R-squared: 0.4219
F-statistic: 14.86 on 1 and 18 DF, p-value: 0.001159
- X4 1 87911 192140 191.41
Step: AIC=179.9
Y ~ X3 + X4 + X5
Df Sum of Sq RSS AIC
- X3 1 3996 112075 178.62
- X5 1 5191 113270 178.84
<none> 108079 179.90
- X4 1 93574 201652 190.37
学生学号
0120814440111
实验课成绩
学生实验报告书
实验课程名称
统计计算(R软件)
开课学院
理学院
指导教师姓名
毛树华
学生姓名
李旭升
学生专业班级
统计学0801
2010—2011学年第2学期
实验项目名称
多元分析的R软件实现
实验者
李旭升
专业班级
统计学0801
同组者
实验日期
2011-6-1
一、实验题目
卫星应用推动了银----锌电池的发展,表1列出了表征电池的在其寿命周期内失效的性能失效数据,利用这些数据:
> Y<-M[,1];X1<-M[,2];X2<-M[,3];X3<-M[,4];X4<-M[,5];X5<-M[,6];X6<-M[,7]
> Y<-M[,6];X1<-M[,1];X2<-M[,2];X3<-M[,3];X4<-M[,4];X5<-M[,5]; #vector assignment
-178.735 -26.345 -1.327 22.221 167.110
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 214.066 222.602 0.962 0.353
X1 -32.214 45.401 -0.710 0.490
<none> 114051 176.97
- X4 1 94179 208230 187.01
> summary(mul_step)
Call:
lm(formula = Y ~ X4)
Residuals:
Min 1Q Median 3Q Max
-151.803 -46.733 -4.664 32.062 198.853
76.8
30
2
160
1
1.25
60
0
2
3
1.625
1.25
43.2
30
1.99
216
1.625
1.25
60
20
2
73
0.375
3.13
76.8
30
1.99
314
0.375
3.13
60
20
2
170
一、实验步骤及结果分析(R语言程序)
1、数据的读取及初步的多元回归分析模型
M<-read.table("1234.txt",head=TRUE)
1.625
3.13
60
20
2
16
1.625
3.13
60
20
2.02
188
0.375
5
76.8
10
2.01
10
1
5
43.2
10
1.99
3
1
5
43.2
30
2.01
386
1
5
100
2
0
45
1.625
5
76.8
10
1.99
2
0.375
1.25
76.8
10
2.01
76
1
1.25
43.25
Step: AIC=178.62
Y ~ X4 + X5
Df Sum of Sq RSS AIC
- X5 1 1976 114051 176.97
<none> 112075 178.62
- X4 1 91305 203380 188.54
Step: AIC=176.97
Y ~ X4
Df Sum of Sq RSS AIC
二、实验结果分析
逐步回归法:
根据逐步回归法选入的自变量为X4,则回归方程为:
由此可知,对电池影响最大的是温度因素。
> sdres<-rstandard(mul_step)
> sdres
1 2 3 4 5 6
-2.21633551 -0.61434217 -0.32872226 0.04523956 -0.16847822 -1.36034107
7 8 9 10 11 12
0.85763938 -0.60160701 -0.69348282 2.64726058 0.57698808 -0.70660793
Step: AIC=181.17
Y ~ X1 + X3 + X4 + X5
Df Sum of Sq RSS AIC
- X1 1 3850 108079 179.90
- X5 1 6552 110780 180.39
- X3 1 6641 110869 180.41
<none> 104228 181.17
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -9.819 36.334 -0.270 0.79004
X4 6.566 1.703 3.855 0.00116 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
X2 1.111 14.756 0.075 0.941
X3 -1.575 1.671 -0.943 0.362
X4 6.873 1.999 3.438 0.004 **
X5 -53.054 59.835 -0.887 0.390
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
13 14 15 16 17 18
0.26465057 0.29090080 -0.36140154 0.18099931 0.38410766 -0.62531267
19 20
1.68874875 0.62552515
残差分布较分散,无明显趋势,且QQ图显示叫符合正态分布的假设。
同时分析标准化残差,也得到每一个自变量对应的标准化残差都小于2,满足要求。