当前位置:文档之家› 多元线性回归预测法

多元线性回归预测法

i 1 n xi1 xi 2 i 1 n 2 xi2 i 1
此时
ˆ ˆ ˆ 得出 0 , 1, 2 的计算公式如下:
n n A X ' X xi1 i 1 n xi 2 i 1
x x
i 1 i 1 n
F p, n p 1
第三步,判断。若 F F p, n p 1 ,则认为回归方 程有显著意义,也就是p1=p2=…=pp=0不成立;反之,则认 为回归方程不显著. F统计量与可决系数,相关系数有以下关系:
R2 n p F 1 R2 p 1 R
(4-39) (4-40)
多元线性回归预测法
多元线性回归模型 估计回归参数 多元线性回归模型的检验 预测区间 标准化回归系数
一、多元线性回归模型
设随机变量y与x1,x2,…,xp一般变量的线性回归模型为
yi 0 1xi1 2 xi 2 p xip i
(4-20)
1 其中,0 , 1,, p 是p+1个未知参数, 0 称为回归常数,,, p 称为回归系数。y称为因变量,而x1,x2,…,xp是p个可以精确测 量并可控制的一般变量,称为自变量。 i 是随机误差,对随 机误差项假定
i 1
n
n
S 22 xi 2 x2
2
S 21 S12 xi1 x1 x12 x2 ,
S1 y xi1 x1 yi y ,
n i 1
i 1
S 2 y xi 2 x2 yi y
n i 1

ˆ 1 ˆ 2
R ˆ yi yi 2 1 yi yi 2
yi y 2 ˆ yi y 2
(4-32)
复相关系数检验的步骤为:
第一步,计算复相关系数
二元回归方程复相关系数的计算常用其简捷公式
R
y 1
2 i
ˆ ˆ ˆ 1 yi 2 xi1 yi 3 xi 2 yi
ˆ ˆ E' E (Y Y )'(Y Y ) 最小值

E' E (Y XB)'(Y XB) 最小值
由极值原理,根据矩阵求导法则,对B求导,并令其等于零,则得
E ' E Y XB' Y XB B B Y ' Y 2Y ' XB B' X ' XB B 2Y ' X '2 X ' X B 0
Sy ˆ yi yi n p 1
2
(4-41)
其中二元和三元估计标准误差的简捷公式分别为
Sy
y
2 i
ˆ ˆ ˆ 1 yi 2 xi1 yi 3 xi 2 yi n3
(4-42)
ˆ ˆ ˆ ˆ yi2 1 yi 2 xi1 yi 3 xi 2 yi 4 xi 3 yi (4-43) Sy n4
2. 拟合优度检验
拟合优度用于检验回归方程对样本观测值的拟合程度。
定义复可决系数R2
yi yi 2 yi y 2 ˆ ˆ 2 R 1 yi y 2 yi y 2
0 R2 1
(4-35)
复可决系数R2是检验多元线性回归模型拟合优度的度量 指标,R2越接近1,表示拟合得越好;反之,则拟合得不 好。
D i 2 E i 0 2 , i j cov , i j 0, i j
i 1,2,, n i, j 1,2,, n
对一个实际问题,如果我们获得n组观测数据(xi1,xi2,…,xip;yi), i=1,2,…,n,则线性回归模型式(4-20)可表示为
p 1F n p p 1F
4. 回归系数的显著性检验——t检验 检验假设
H0 : j 0, j 1,2,, p
如果接受原假设 H0j ,则 xj 不显著;如果拒绝原假设 H0j , 则 xj是显著的。 t检验的具体步骤如下: 第一步,计算估计标准误差
n
(4-27)
xi1 x
i 1 i 1 n 2 i1
x
i 1
n
i1
xi 2
(4-28)
以上计算公式较繁,较易算的计算公式为
x1 1 n
x
i 1
n
i1
,
1 1 n x2 xi 2 , y n n i 1
2 n i 1
y
i 1
n
i
S11 xi1 x1 ,
定义一个校正R2,记为 R 2
ˆ yi yi 2 /(n p) R 2 1 yi y 2 /(n 1)
(4-36)
yi yi 2 的自由度,n-1是总离 这里,n-p是残差平方和 yi y 2 的自由度。 差平方和
根据式(4-35)和(4-36)可得与之间关系如下 n 1 (4-37) R 2 1 (1 R 2 )
如果H0被接受,则表明随机变量y与x1,x2,…,xp之间的关 系由线性回归模型表示不合适。 F检验程序如下: 第一步,计算统计量F的值。
F U/p Q /(n p 1)
2 2
ˆ U yi y
(4-38)
ˆ Q yi yi
第二步,对给定的显著性水平 ,查F分布表,得临界值
写成矩阵形式为
y XB
(4-21)
其中
1 y1 1 y y 2 , X 1 yn 0 1 1 B , 2 p n
整理得回归系数向量B的估计值
1 ˆ B X ' X X 'Y
(4-24)
2. 二元线性回归方程回归系数的估计
二元线性回归方程为
ˆ ˆ ˆ ˆ yi 0 1xi1 2 xi 2 , ( p 2)
1 ˆ 0 1 ˆ ˆ B 1 , X ˆ 2 1 x11 x21 xn1 x12 x22 xn 2
第二步,计算样本标准差
S ˆ c jj S y
j
(4-44)
式中 Cjj 为矩阵 (X’X)-1 对角线上第j个元素。 第三步,计算 t 统计量
ˆ j tj S ˆ j 1,2,, p
(4-45)
j
第四步,对给定的显著水平 ,查自由度为n-p的t 分 布表,得 t n p
y
(4-33)
2 i
ny 2
三元回归方程R计算常用其简捷公式
R 1 ˆ ˆ ˆ ˆ y i2 1 yi 2 xi1 yi 3 xi 2 yi 4 xi 3 yi yi2 ny 2
(4-34)
第二步,根据回归模型的自由度n-p和给定的显著性水平值 查相关系数临界表,得 R n p 值 第三步,判断。若 R R n p ,表明变量之间线性相关显著, 检验通过,这时回归模型可用来进行预测。若 , R R n p 表明变量之间线性相关关系不显著,检验通不过,这时的回归 模型不能用来预测,应分析原因,对回归模型重新加以处理。
n
n
n
根据DW统计量,检验模型是否存在自相关,其步骤如下: 第一步,利用最小平方法求回归模型及残差 ei ; 第二步,利用式(4-46)、(4-47)或(4-48)可以计算 DW 统计量; 第三步,确立假设 相关;
S1 y S 22 S 2 y S12 S11S 22 S12 S 21 S 2 y S11 S1 y S 21 S11S 22 S12 S 21
(4-29)
(4-30) (4-31)
ˆ ˆ ˆ 0 y 1 x 2 x2
三、多元回归模型的检验
1. 复相关系数检验 检验线性关系密切程度的指标称为相关系数,在多元回 归模型中,由于自变量在两个以上,所以称为复相关系数. 样本复相关系数的计算公式是
i 2 i 2 i 2
n ei ei 1 2(1 R ) (4-48) DW 21 i 2n 1 2 ei i 2 R1是 i 与 i 1 的相关系数 1 的估计量。当 i 与 i 1 正 自相关时, R1 1,DW 0;当 i 与 i 1 负相关时, R1 -1,DW 4;若不存在自相关或相关程度很小时, R1 0,DW 2 。从式(4-48)可以看出,DW值在 0~4之间。
n
i1 2 i1
x
n
i2
(4-25)
x
i 1
n
i1
xi 2
n yi ni 1 1 ˆ 0 x y i1 i A i 1 n xi 2 yi i 1 n 1 n ˆ 1 xi A i 1 1 n xi 2 i 1 n 1 n ˆ 2 x i1 A i 1 n xi 2 i 1
y1 0 1 x11 2 x12 p x1 p 1 y2 0 1 x21 2 x22 p x2 p 2 y x x x 0 1 n1 2 n2 p np n n
因 ei 1 的最初序号也必须是1,所以分子求和公式 必须从2开始。将式(4-46)展开,得
DW e 2 ei ei 1 ei21
i 2 2 i i 2 n i 2 n n n
(4-47)
ei2
i 1
在大样本情况下,即n>30,可以认为 ei2 ei21 ei2 所以上式可以写成
相关主题