当前位置:文档之家› 多元线性回归模型的预测

多元线性回归模型的预测

2 2
中国居民人均收入-消费支出二元模型例中: 2001年人均GDP:4033.1元,
于是人均居民消费的预测值为
Ŷ2001=120.7+0.2213×4033.1+0.4515×1690.8=1776.8(元)
实测值(90年价)=1782.2元,相对误差:-0.31%
预测的置信区间 :
1.88952 0.00285 0.00828 0.00828 0.00001 0.00001 0.00001 0.00004 0.00285
容易证明
2 1 ˆ ~ N (X β Y , X ( X X) X 0 0 0 0)
ˆ E(Y ) Y 0 0 ˆ X 0 (X X) 1 X 0
~ t ( n k 1)
于是,得到(1-)的置信水平下E(Y0)的置信区间:
1 1 ˆ t ˆ t ˆ ˆ Y X ( X X ) X E ( Y ) Y X ( X X ) X 0 0 0 0 0 0 0
2 2
其中,t/2为(1-)的置信水平下的临界值。
二、Y0的置信区间
如果已经知道实际的预测值Y0,那么预测误差为:
ˆ e0 Y0 Y 0
容易证明
ˆ) E (e0 ) E ( X 0β 0 X 0β ˆ β)) E ( 0 X 0 (β E ( 0 X 0 ( X X ) 1 X μ) 0
§3.4 多元线性回归模型的预测
一、E(Y0)的置信区间 二、Y0的置信区间
对于模型
ˆ Xβ ˆ Y
给 定 样 本 以 外 的 解 释 变 量 的 观 测 值 X0=(1,X10,X20,…,Xk0) ,可以得到被解释变量的预 测值: ˆ Xβ ˆ Y 0 0
它可以是总体均值E(Y0)或个值Y0的预测。 但严格地说,这只是被解释变量的预测值的估 计值,而不是预测值。 为了进行科学预测,还需求出预测值的置信 区间,包括E(Y0)和Y0的置信区间。
一、E(Y0)的置信区间
易知
ˆ ) E (X β ˆ ˆ ) X 0β E (Y0 ) E (Y 0 0 ) X 0 E (β
2 ˆ ) E (X β ˆ ˆ β ˆ β)) Var (Y X β ) E ( X 0 (β )X 0 (β 0 0 0

ˆ ) E ( X (β ˆ β)( β ˆ β)X0 ) Var (Y 0 0 ˆ β)( β ˆ β)X X 0 E (β 0 2 X 0 ( XX) 1 X 0
( X X) 1
1 X ( X X) X 0 0.3938 0
于是E(Ŷ2001)的95%的置信区间为:
1776 .8 2.093 705 .5 0.3938

(1741.8,1811.7)
1776 .8 2.093 705 .5 1.3938
同样,易得Ŷ2001的95%的置信区间为 或 (1711.1, 1842.4)
构造t统计量
ˆ Y Y 0 t 0 ~ t ( n k 1) ˆ e0
可得给定(1-)的置信水平下Y0的置信区间:
1 1 ˆ t ˆ t ˆ ˆ Y 1 X ( X X ) X Y Y 1 X ( X X ) X 0 0 0 0 0 0 0
2 Var (e0 ) E (e0 )
E ( 0 X 0 ( X X ) 1 X μ) 2 2 (1 X 0 ( X X ) 1 X 0 )
e0服从正态分布,即
e0 ~ N (0, 2 (1 X 0 ( XX) 1 X 0 ))
2 2 1 ˆ ˆ e0 (1 X 0 ( X X) X0 ))
相关主题