第7章模型选择:标准与检验
事实上,
E(a2 )=B2 +B3b32
E(a1) B1 B3 ( X 3 b32 X 2 )
(2)则a1和a2是不是一致的,即如论样本多大,偏差也不会 消失。
2-5
(3)如果遗漏的变量X3与X2不相关,则a1是有偏的,a2是 无偏的。
E(a1) B1 E(a2 )=B2
(4)根据(7-2)得到的误差方差是真实误差方差 2的
利用美国1959-2006年美国进口商品支出(Y)和个 人可支配收入(X)数据进行上面两个模型的回归 得:
Yˆt 36.295.3168 0.2975Xt 18.5253year
t (6.3790)*(20.5203)*( 6.4030)*
R2
0.9939,
2
R
0.9932, F
1376.7802
预测能力(predictive power)选择理论预测与实 践相吻合的模型。
2-2
7.2 设定误差的类型
主要介绍一些实践中经常遇到的设定误差: 遗漏相关变量 包括不必要变量 采用了错误的函数形式 度量误差
2-3
Venn diagram.
7.3 遗漏相关变量:“过低拟合”模型
遗漏变量偏差(omitted variable bias)。
lnYˆt 36.295.3168 0.2975ln Xt 18.5253 year t (0.7014)(13.6501)*(1.2015)
R2
2
0.9959, R
0.9957, F
5421.7932.7802
2-14
两个模型的R2都很高,都是显著的。 那么怎么对两个模型进行选择呢。 7.7节将进行讨论。
解释变量中的度量误差比较严重,当然应变量和解释变 2-16 量都存在度量误差更严重。
7.7 诊断设定误差:设定误差的检验
(7.7.1)诊断非相关变量的存在
2-18
2-19
(7.7.2)对遗漏变量和不正确函数形式的检验
判定模型是否恰当主要根据以下一些参数:
1. R2和校正后的 R(2 R 2)
第7章 模型选择:标准与检验
McGraw-Hill/Irwin
Copyright © 2006 The McGraw-Hill Companies, Inc. All rights reserved.
7.1 “好的”模型具有的性质
经济计量学家哈维(A.C.Harvey)列出了模型判断 的一些标准 :
回归模型的估计后果如下:
1.“不正确”模型的OLS估计量是无偏的(也是一致的)。
2.从回归方程(7.10)中得到的 2 的估计量是正确的。
3.建立在t检验和F检验基础上的标准的置信区间和假设检验仍 然是有效的。 4.从回归方程(7.10)中估计的 a 却是无效的——其方差比从 真实模型(7.9)中估计的的方差大。
2-15
7.6 度量误差
应变量中的度量误差
1.OLS估计量是无偏的。 2.OLS估计量的方差也是无偏的。 3. 估计量的估计方差比没有度量误差时的大。因为应变量
中的误差加入到了误差项 u i中。
因此,应变量的度量误差引起的后果不太严重。
解释变量中的度量误差
1.OLS估计量是有偏的。 2.OLS估计量也是不一致的。即使样本容量足够大,OLS 估计量仍然是有偏的。
在模型(7-13)中,如果漏掉了时间趋势变量,对下面 模型进行回归,得:
Yt B1 B2Xt vt (7 19) Yˆt 136.1649 0.2082Xt t (5.7782)(38.0911() 6.4030)
2-23
r 2 0.9693
如果用(7 19)进行估计则隐含的认为 vt B3X3t ut
此时误差项vt不仅要反应ut的信息,还要反应变量 X3的信息。
2-24
图7-2 回归(7.13)和(7.20)的残差
S2的图形表明:即使增加了趋势变量,残差也不是随机分布的, 说明模型(7-13)本身设定的不正确。
2-25
除了残差图还可以用其他方法进行检验:
(1)麦克金农-怀特-戴维森检验(MWD检验); (2)拉姆齐检验RESET; (3)沃尔德检验 (4)拉格朗日乘子检验; (5)豪斯曼检验 (6)博克斯-考克斯变换。
2-11
2-12
7.5 不正确的函数形式
现在考虑另一种设定误差。假设模型包括的变 量Y,X 2,X 3都是理论上正确的变量。考虑如 下两种模型设定:
Yt B1 B2 X 2t B3 X 3t ut ln Yt A1 A2 ln X 2t A3 X 3t vt
2-13
例7-3美国进口商品支出
简约性(parsimony)简单优于复杂或者简约原 则表明模型应尽可能简单。
可识别性(identifiability)对于给定的一组数据, 估计的参数值必须是唯一的。
拟合优度(goodness of fit)校正的R2越高,模 型越好。
理论一致性(theoretical consistency)一旦模型 中的一个或多个系数的符号有误,就不能说是一 个好模型。
有偏估计量。
(5)a2的方差(
µ2 )是真实估计量b 的有偏估计量。
x22
2
(6)置信区间和假设检验不可靠。
2-6
2-7
2-8
2-9
2-10
7.4 包括不相关变量:“过度拟合”模 型
Yi B1 B2 X 2i ui
(7-9)
Yi A1 A2 X 2i A3 X 3i vi (7-10)
2.估计的 t 值
3.与先验预期相比,估计系数的符号
2-20
(7.7.2)对遗漏变量和不正确函数形式的检验
2-21
判定模型是否恰当主要根据以下一些参数:
1. R2和校正后的 R(2 R 2)
2.估计的 t 值
3.与先验预期相比,估计系数的符号
2-22
残差检验
残差图可以显示模型的设定误差,比如遗漏了 变量或者是使用了不正确的模型形式。 还可以诊断异方差和自相关。
如果研究者由于某种原因在模型构建过程中遗漏了 一个或者几个变量,对OLS估计会有什么影响? 例如将模型
Yi B1 B2 X 2i B3 X3i u(i 7-1)
误写成 Yi A1 A2 X2t v(t 7-2)
2-4
(1)如果遗漏的变量X3与X2相关,则a1和a2是有偏的,即 E(a1) B1 E(a2 ) B2