当前位置：文档之家› 第三章多元线性回归模型

第三章多元线性回归模型

15
3.2最小二乘估计量的统计特性
• 线性性 • 无偏性
• 最小方差性（有效性）
• 高斯－马尔可夫（Gauss-Markov）定理
假定条件（与一元线性回归模型相似）
假定1：所有解释变量都为可控变量或确定性变量
假定2： E(ui) = 0 i＝1,2…n
u1 E (u1 ) 0 u E (u ) 0 2 E ( u) E 2 0 u E ( u ) 0 n n
1 X 11 X 21 X k1
1 Yi X 11 X 1iYi X 21 X kiYi X k1
Xk2
1 1 X 1n 1 X 2n 1 X kn
X k1 0 u1 Xk2 u2 1 X kn n( k 1) k ( k 1)1 un ( n1)
因此：这个模型相应的矩阵表示形式为：Y
x。 x k1 21 x 22 x k 2 x 2 n x kn
y1 y 2 x ji X ji X j (i 1,2,, n, j 1,2,, k y 14 y n
例题3.1 美国黑人女性工人收入与受教育年数、工作经验之间的数量关系（P58-59）
ˆ +β ˆX + β ˆ X +...+ β ˆ X +e Yi = β 0 1 1i 2 2i k ki i
ˆ e Y Xβ
ˆ + ˆX + ˆ X +...+ ˆX ˆ = Y i 0 1 1i 2 2i k ki
ˆ ˆ Xβ Y
其中：
ˆ Y 1 Y ˆ ˆ 2 Y ˆ Yn n1 ˆ 0 ˆ ˆ 1 β ˆ k ( k 1)1
= X + U
0 u1 u 1 β u 2 u n ( n1 ) k ( k 1） 1
2、总体回归函数 E(Y) = 0 +1X1 +…+ kX k 矩阵形式为： E(Y) = X 3、样本回归模型矩阵形式为： 4、样本回归函数矩阵形式为：
ˆ 1 ˆ 2 ˆ k
x11 x x 12 x 1n
(0) ˆ ( xx) 1 xy ˆ Y ˆ X ˆ X 0 1 1 k k
（推导过程见P57）
这里 ˆ (0)
n
x x
i 1
n
i 1 n 2 1i i 1
x2i
2 2i
( x1i x2i ) 2
i 1
n
其中
ˆ Y ˆ X ˆ X 0 1 1 2 2
x ji X ji X j ( j 1,2)
yi Yi Y
13
几个常用的结论
① 残差的均值
1 n e ei 0 n i 1
ˆ X' Y X' Xβ
β的最小二乘（OLS）估计量为：
ˆ (X' X) 1 X' Y β
对于一元回归模型：
Y1 Y2 Y Y n ( n1)
1 X1 1 X2 X 1 X n n 2
wage 0 1edu 2 sex 3race 4 ability 5 work ui
其中，0为截距， 1、 2、3、4和5称为偏回归系数，表示其他因素不变的情况下，对应解释变量的变化对被解释变量的影响。例如， 3反映了在性别、种族、工作经验和个人能力不变的情况下，受教育年限每增加1年，每小时收入增加 3美元。
表示被解释变量样本观测值的拟合值的列向量；
表示未知参数估计值的列向量；
e1 e e 2 en n1
表示残差（随机误差项估计值）的列向量。
偏回归系数的解释对总体回归函数
E(Y ) 0 1 X1 2 X 2 k X k
X 21 X 22 X 2n
X 31 X 32 X 3n
X k1 X k2 X' X X kn
于是有：
1 X 12 X 22 Xk2
1 Y 1 X 1n Y 2 X 2n X' Y Y n X kn
Y1 Y Y 2 Y n ( n1 )
1 X 11 1 X 12 X 1 X 1n X 21 X 22 X 2n X 31 X 32 X 3n X k1 Xk2 X kn n( k 1)
1 X' X X 1
1 X2
1 X1 1 1 X 2 n X Xn i 1 X n
1 X2
X X
i 2 i

1 X 'Y X 1
Y1 1 Y2 Yi X Y Xn i i Y n
偏回归系数 j （j 1,2,, k）的意义：在保持其他解释变量不变的条件下，解释变量Xj增加一个单位，平均来说， j 反映了Xj的单位被解释变量Y增加βj个单位。也就是说，变化对被解释变量Y 的“净”影响（不含其他变量的影响）程度。一点说明：
对偏回归系数的解释是在保持其他解释变量不变的条件下进行的，若不能做到这一点，也就是说，当解释变量Xj的取值变化时有别的解释变量在同一观测点处的取值也随着变化，那么响程度。
ˆ β ˆ X β ˆ ˆ nβ 0 1 1i 2 X 2 i βk X ki Yi 整理得： β ˆ ˆ X2 β ˆ ˆ X β 0 1i 1 1i 2 X 2 i X 1i βk X ki X 1i X 1iYi β 2 ˆ ˆ X X β ˆ ˆ X β X X β X k ki X kiYi 0 ki 1 1i ki 2 2i ki
i 1 i 1i n i 1 2 2i i 1 i 2i i 1
n
n
n
n
1i 2 i
x
x x
n
i 1
2 1i
n
ˆ 2
y x x y x x
i 1 i 2i
i 1 n
2 2i
2 1i
( x1i x2i ) 2
i 1 n
n i 1 i 1i i 1 1i
ˆ ˆ X ˆ X ˆ X )2 (Yi 0 1 1i 2 2i k ki
i 1
n
根据多元函数求极值的必要条件，性方程组：
ˆ , ˆ ,, ˆ 应满足下列线 0 1 k
Q ＝0，i 0,1, , k ˆ i
即：
Q ˆ ˆ X ˆ X ˆ X ) ( 1) 0 2 (Yi 0 1 1i 2 2i k ki ˆ 0 Q ˆ ˆ ˆ ˆ ˆ 2 (Yi 0 1 X 1i 2 X 2i k X ki ) ( X 1i ) 0 1 Q ˆ ˆ ˆ ˆ ˆ 2 (Yi 0 1 X 1i 2 X 2i k X ki ) ( X ki ) 0 k
例题，（见p54）
7
3.1.2最小二乘法
一、参数的最小二乘估计二、离差形式的最小二乘估计
三、随机误差项方差σ2的估计量
参数的最小二乘估计
– 根据最小二乘准则：
ˆ , ˆ ,， ˆ） Q( 0 1 k
ei
2 i 1 n 2 ˆ ( Y Y ) i i i 1 n
n 1 ˆ β (X' X) X' Y X i
X X
i 2 i

1
Yi X Y i i
例如，二元线性回归模型
Yi 0 1 X1i 2 X 2i ui
参数的OLS估计量分别为
ˆ 1
y x x y x x
② 拟合值的样本均值与实际观测值的样本均值相等，即
n 1 ˆ Y，其中Y ˆ Y ˆ Y i n i 1
，
③ 样本均值 X1 , X k , Y
④
满足如下等式： Y
ˆ ˆ X ˆ X 0 1 1 k k
ˆe y
i 1
n
i i
0
参数估计量的离差表达式：
第三章多元线性回归模型
• 多元回归模型的引入
• 模型的矩阵表示 • 最小二乘估计 • 最小二乘估计量的基本性质 • 可决系数（R2）
• 估计量的检验与置信区间
• 预测
• 案例分析
多元回归模型的引入
受教育年限与每小时工资： ˆ 0.0144 0.7241 Y X
i i
实际中影响每小时工资的可能还有工作经验、性别、种族和个人能力等。综合考虑这些因素，可以建立下面的多元回归模型：
因为：
n
X

1i
X X

1i 2 1i
X X X
2i 2i

1i
X ki

X X X
ki
X
1 X 12 X 22
ki
X

1i
X
X 11 X 12 X 1n

e商务文档

第三章多元线性回归模型

相关文档推荐：

e商务文档

第三章 多元线性回归模型

相关文档推荐：

第三章多元线性回归模型