当前位置：文档之家› 多元线性回归模型的预测

多元线性回归模型的预测

2 2
中国居民人均收入-消费支出二元模型例中： 2001年人均GDP：4033.1元，
于是人均居民消费的预测值为
Ŷ2001=120.7+0.2213×4033.1+0.4515×1690.8=1776.8（元）
实测值（90年价）=1782.2元，相对误差：-0.31%
预测的置信区间：
1.88952 0.00285 0.00828 0.00828 0.00001 0.00001 0.00001 0.00004 0.00285
容易证明
2 1 ˆ ~ N (X β Y , X ( X X) X 0 0 0 0)
ˆ E(Y ) Y 0 0 ˆ X 0 (X X) 1 X 0
~ t ( n k 1)
于是，得到(1-)的置信水平下E(Y0)的置信区间：
1 1 ˆ t ˆ t ˆ ˆ Y X ( X X ) X E ( Y ) Y X ( X X ) X 0 0 0 0 0 0 0
2 2
其中，t/2为(1-)的置信水平下的临界值。
二、Y0的置信区间
如果已经知道实际的预测值Y0，那么预测误差为：
ˆ e0 Y0 Y 0
容易证明
ˆ) E (e0 ) E ( X 0β 0 X 0β ˆ β)) E ( 0 X 0 (β E ( 0 X 0 ( X X ) 1 X μ) 0
§3.4 多元线性回归模型的预测
一、E(Y0)的置信区间二、Y0的置信区间
对于模型
ˆ Xβ ˆ Y
给定样本以外的解释变量的观测值 X0=(1,X10,X20,…,Xk0) ，可以得到被解释变量的预测值： ˆ Xβ ˆ Y 0 0
它可以是总体均值E(Y0)或个值Y0的预测。但严格地说，这只是被解释变量的预测值的估计值，而不是预测值。为了进行科学预测，还需求出预测值的置信区间，包括E(Y0)和Y0的置信区间。
一、E(Y0)的置信区间
易知
ˆ ) E (X β ˆ ˆ ) X 0β E (Y0 ) E (Y 0 0 ) X 0 E (β
2 ˆ ) E (X β ˆ ˆ β ˆ β)) Var (Y X β ) E ( X 0 (β )X 0 (β 0 0 0

ˆ ) E ( X (β ˆ β)( β ˆ β)X0 ) Var (Y 0 0 ˆ β)( β ˆ β)X X 0 E (β 0 2 X 0 ( XX) 1 X 0
( X X) 1
1 X ( X X) X 0 0.3938 0
于是E(Ŷ2001）的95%的置信区间为:
1776 .8 2.093 705 .5 0.3938
或
（1741.8，1811.7）
1776 .8 2.093 705 .5 1.3938
同样，易得Ŷ2001的95%的置信区间为或（1711.1, 1842.4）
构造t统计量
ˆ Y Y 0 t 0 ~ t ( n k 1) ˆ e0
可得给定(1-)的置信水平下Y0的置信区间：
1 1 ˆ t ˆ t ˆ ˆ Y 1 X ( X X ) X Y Y 1 X ( X X ) X 0 0 0 0 0 0 0
2 Var (e0 ) E (e0 )
E ( 0 X 0 ( X X ) 1 X μ) 2 2 (1 X 0 ( X X ) 1 X 0 )
e0服从正态分布，即
e0 ~ N (0, 2 (1 X 0 ( XX) 1 X 0 ))
2 2 1 ˆ ˆ e0 (1 X 0 ( X X) X0 ))

e商务文档

多元线性回归模型的预测

相关文档推荐：