当前位置:文档之家› 多元线性回归模型

多元线性回归模型

Y1 1 2 X 21 3 X31 ... k X k1 u1 Y2 1 2 X 22 3 X32 ... k X k2 u2
Yn 1 2 X 2n 3 X3n ... k X kn un
11
用矩阵表示
Y1 1
Y2
1
Yn
1
Y
n1
X 21 X 22
X 2n
例如:有两个解释变量的电力消费模型
Yi 1 2 X 2 3 X3 ui
其中: Yi 为各地区电力消费量;
X 2为各地区国内生产总值(GDP);
X
为各地区电力价格变动。
3
模型中参数的意义是什么呢?
6
多元线性回归模型的一般形式
一般形式:对于有 k 个解释变量的线性回归模型
Yi 1 2 X 2i 3 X 3i ... k X ki ui
Rank(XX ) K
ui ~ N (0, σ 2 )
15
ห้องสมุดไป่ตู้
第二节 多元线性回归模型的估计
本节基本内容:
● 普通最小二乘法(OLS) ● OLS估计式的性质 ● OLS估计的分布性质
● 随机扰动项方差 的估2 计
● 回归系数的区间估计
16
一、普通最小二乘法(OLS)
最小二乘原则
剩余平方和最小: min ei2 (Yi -Yˆi)2
ˆ3 (
yi x3i )( x22i ) - ( yi x2i )( x2i x3i ) ( x22i )( x32i ) - ( x2i x3i )2
注意: x 和 y为 X,Y 的离差
20
二、OLS估计式的性质
OLS估计式
1.线性特征: βˆ = (X X)-1 X Y
βˆ 是 Y的线性函数,因 ( X X)-1 X 是非随机
8
多元总体回归函数
Y 的总体条件均值表示为多个解释变量的函数
E(Yi X2i , X3i ,..., Xki ) 1 2 X2i 3X3i ... k Xki
总体回归函数也可表示为:
Yi 1 2 X2i 3X3i ... k Xki ui
9
多元样本回归函数
Y 的样本条件均值表示为多个解释变量的函数
R2
ESS TSS
βˆ XY - nY 2 Y Y - nY 2
可以证明:R2 βˆ 2 x2i yi βˆ3 x3i yi ... βˆ k xki yi
特点:
yi2
多重可决系数是模型中解释变量个数的不减函数,
这给对比不同模型的多重可决系数带来缺陷,所以
需要修正。
30
修正的可决系数
1 X 22
X kiei
X
k1
Xk2
1 e1
0
X
2n
e2
=
X
e
=
0
X
kn
en
0
X
e
因为样本回归函数为 Y = Xβˆ + e
两边乘 X 有: X Y = X Xβˆ + X e
因为 Xe = 0 ,则正规方程为:
X Xβˆ = X Y
19
OLS估计式
由正规方程 多元回归中 二元回归中
● ui是服从正态分布的随机变量, 决定了Yi 也
是服从正态分布的随机变量
● βˆi 是 Yi 的线性函数,决定了 βˆi 也是服从正态
分布的随机变量
23
βˆ 的期望 E(βˆ) β (由无偏性)
βˆ 的方差和标准误差: 可以证明βˆ 的方差-协方差矩阵为
Var - Cov(βˆ) σ2(X X )-1 Var(βˆ j ) σ2cjj SE(βˆ j ) σ cjj 这里是 c jj 矩阵( X X )-1 中第j 行第 j 列的元素
修正的可决系数 R2与可决系数 R2的关系:
2
R
1- (1-
R2 )
n -1
n-k
特点
可决系数 R2必定非负,但修正的可决系数 R2 可能为负值,这时规定 R2 0
33
二、回归方程显著性检验(F检验)
基本思想
在多元回归中有多个解释变量,需要说明所有解 释变量联合起来对应变量影响的总显著性,或整个 方程总的联合显著性。对方程总显著性检验需要 在方差分析的基础上进行F检验。
或 其中
Yˆi ˆ1 ˆ2X2i ˆ3X3i ... ˆk Xki Yi ˆ1 ˆ2X2i ˆ3X3i ... ˆk Xki ei
i 1,2, , n
回归剩余(残差): ei Yi -Yˆi
10
二、多元线性回归模型的矩阵表示
k 个解释变量的多元线性回归模型的 n个观测
样本,可表示为
27
第三节 多元线性回归模型的检验
本节基本内容:
●多元回归的拟合优度检验 ●回归方程的显著性检验(F检验) ●各回归系数的显著性检验(t检验)
28
一、多元回归的拟合优度检验
多重可决系数:在多元回归模型中,由各个解释变量联合
解释了的 Y的变差,在Y 的总变差中占的比重,用 R2 表

与简单线性回归中可决系数 R2的区别只是 Yˆi 不同,多元
26
五、回归系数的区间估计
由于
t*
=
βˆ j - β
^
SE(
βˆ
j
j
)
=
βˆ j σˆ
- βj c jj
~ t(n - k)
给定 ,查t分布表的自由度为 n k的临界值 t 2 (n - k)
P[-tα
2
(n
-
k)
t*
βˆ j - β j
^
SE(
βˆ
j
)

2
(n
-
k )]
1-
α
( j 1,..., k)
是什么因素导致中国汽车数量的增长? 影响中国汽车行业发展的因素并不是单一的,经济增长、 消费趋势、市场行情、业界心态、能源价格、道路发展、内 外环境,都会使中国汽车行业面临机遇和挑战。
2
怎样分析多种因素的影响?
分析中国汽车行业未来的趋势,应具体分析这样一些问题: 中国汽车市场发展的状况如何?(用销售量观测) 影响中国汽车销量的主要因素是什么?
25
因 2是未知的,可用 ˆ 2代替 2 去估计参数 βˆ 的标
准误差:
● 当为大样本时,用估计的参数标准误差对 βˆ 作标
准化变换,所得Z统计量仍可视为服从正态分布
●当为小样本时,用估计的参数标准误差对 βˆ 作标
准化变换,所得的t统计量服从t分布:
t
βˆk - βk
^
~ t(n - k)
SE( βˆk )
min ei2 [Yi - (ˆ1 ˆ2X2i ˆ3X3i ... ˆk Xki )]2
求偏导,令其为0:
( ei2 )
ˆ j
0
17

-2 Yi - (ˆ1 ˆ2 X2i ˆ3X3i ... ˆki Xki ) 0
-2 X2i Yi - (ˆ1 ˆ2X2i ˆ3X3i ... ˆki Xki ) 0
(如收入、价格、费用、道路状况、能源、政策环境等)
各种因素对汽车销量影响的性质怎样?(正、负) 各种因素影响汽车销量的具体数量关系是什么? 所得到的数量结论是否可靠? 中国汽车行业今后的发展前景怎样?应当如何制定汽车的 产业政策? 很明显,只用一个解释变量已很难分析汽车产业的发展, 还需要寻求有更多个解释变量情况的回归分析方法。
计量经济学
第三章 多元线性回归模型
1
引子:
中国汽车的保有量会达到1.4亿辆吗 ?
中国经济的快速发展,使居民收入不断增加,数以百万 计的中国人开始得以实现拥有汽车的梦想,中国也成为世界 上成长最快的汽车市场。
中国交通部副部长在中国交通可持续发展论坛上做出预 测 :“2020年,中国的民用汽车保有量将比2003年的数字 增长6倍,达到1.4亿辆左右”。
回归中 Yˆi = βˆ1+ βˆ2 X 2i + βˆ 3 X 3i + ...+ βˆ k X ki
多重可决系数也可表示为
R2 ESS TSS
(Yˆi -Y )2 (Yi -Y )2
TSS - RSS TSS
1-
ei2 yi2
29
多重可决系数的矩阵表示
TSS Y Y nY 2
ESS βˆ X Y - nY 2
M
-2 Xki Yi - (ˆ1 ˆ2X2i ˆ3X3i ... ˆki Xki ) 0
ei 0 X2iei 0
M
Xkiei 0
注意到 Yi - (ˆ1 ˆ2 X2i ˆ3X3i ... ˆki Xki ) ei
18
用矩阵表示
ei X 2i ...
ei
=
1 X 21
X Xβˆ = X Y ( X X )kk 是满秩矩阵,其逆存在
βˆ = (X X)-1 X Y
ˆ1 Y - βˆ2 X2 - βˆ3X3
ˆ2 (
yi x2i )( x32i ) - ( yi x3i )( x2i x3i ) ( x22i )( x32i ) - ( x2i x3i )2
故有:βˆ j ~ N(βj ,σ2cjj ) j 1, 2,..., k
24
四、随机扰动项方差 的2 估计
多元回归中σ 2 的无偏估计为:
σˆ 2 ei2
n-k
或表示为 σˆ2 ee
n-k
将 βˆk 作标准化变换:
zk
βˆk - βk SE( βˆk )
βˆk σ
- βk c jj
~
N (0,1)
X 是第一列为1的 nk 阶解释变量
相关主题