当前位置：文档之家› 第7章模型选择：标准与检验

第7章模型选择：标准与检验

事实上，
E(a2 )=B2 +B3b32
E(a1) B1 B3 ( X 3 b32 X 2 )
（2）则a1和a2是不是一致的，即如论样本多大，偏差也不会消失。
2-5
（3）如果遗漏的变量X3与X2不相关，则a1是有偏的，a2是无偏的。
E(a1) B1 E(a2 )=B2
（4）根据（7-2）得到的误差方差是真实误差方差 2的
利用美国1959-2006年美国进口商品支出（Y）和个人可支配收入（X）数据进行上面两个模型的回归得：
Yˆt 36.295.3168 0.2975Xt 18.5253year
t (6.3790)*(20.5203)*（ 6.4030）*
R2
0.9939,
2
R
0.9932, F
1376.7802
预测能力（predictive power）选择理论预测与实践相吻合的模型。
2-2
7.2 设定误差的类型
主要介绍一些实践中经常遇到的设定误差：遗漏相关变量包括不必要变量采用了错误的函数形式度量误差
2-3
Venn diagram.
7.3 遗漏相关变量：“过低拟合”模型
遗漏变量偏差（omitted variable bias）。
lnYˆt 36.295.3168 0.2975ln Xt 18.5253 year t (0.7014)(13.6501)*（1.2015）
R2
2
0.9959, R
0.9957, F
5421.7932.7802
2-14
两个模型的R2都很高，都是显著的。那么怎么对两个模型进行选择呢。 7.7节将进行讨论。
解释变量中的度量误差比较严重，当然应变量和解释变 2-16 量都存在度量误差更严重。
7.7 诊断设定误差：设定误差的检验
（7.7.1）诊断非相关变量的存在

2-18
2-19
（7.7.2）对遗漏变量和不正确函数形式的检验
判定模型是否恰当主要根据以下一些参数：
1. R2和校正后的 R（2 R 2）
第7章模型选择：标准与检验
McGraw-Hill/Irwin
Copyright © 2006 The McGraw-Hill Companies, Inc. All rights reserved.
7.1 “好的”模型具有的性质
经济计量学家哈维（A.C.Harvey）列出了模型判断的一些标准 :
回归模型的估计后果如下：
1.“不正确”模型的OLS估计量是无偏的（也是一致的）。
2.从回归方程（7.10）中得到的 2 的估计量是正确的。
3.建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的。 4.从回归方程（7.10）中估计的 a 却是无效的——其方差比从真实模型（7.9）中估计的的方差大。
2-15
7.6 度量误差
应变量中的度量误差
1.OLS估计量是无偏的。 2.OLS估计量的方差也是无偏的。 3. 估计量的估计方差比没有度量误差时的大。因为应变量
中的误差加入到了误差项 u i中。
因此，应变量的度量误差引起的后果不太严重。
解释变量中的度量误差
1.OLS估计量是有偏的。 2.OLS估计量也是不一致的。即使样本容量足够大，OLS 估计量仍然是有偏的。
在模型（7-13）中，如果漏掉了时间趋势变量，对下面模型进行回归，得：
Yt B1 B2Xt vt (7 19) Yˆt 136.1649 0.2082Xt t (5.7782)(38.0911（) 6.4030）
2-23
r 2 0.9693
如果用(7 19)进行估计则隐含的认为 vt B3X3t ut
此时误差项vt不仅要反应ut的信息，还要反应变量 X3的信息。
2-24
图7-2 回归（7.13）和（7.20）的残差
S2的图形表明：即使增加了趋势变量，残差也不是随机分布的，说明模型（7-13）本身设定的不正确。
2-25
除了残差图还可以用其他方法进行检验：
（1）麦克金农-怀特-戴维森检验（MWD检验）；（2）拉姆齐检验RESET；（3）沃尔德检验（4）拉格朗日乘子检验；（5）豪斯曼检验（6）博克斯-考克斯变换。
2-11
2-12
7.5 不正确的函数形式
现在考虑另一种设定误差。假设模型包括的变量Y，X 2，X 3都是理论上正确的变量。考虑如下两种模型设定：
Yt B1 B2 X 2t B3 X 3t ut ln Yt A1 A2 ln X 2t A3 X 3t vt
2-13
例7-3美国进口商品支出
简约性（parsimony）简单优于复杂或者简约原则表明模型应尽可能简单。
可识别性（identifiability）对于给定的一组数据，估计的参数值必须是唯一的。
拟合优度（goodness of fit）校正的R2越高，模型越好。
理论一致性（theoretical consistency）一旦模型中的一个或多个系数的符号有误，就不能说是一个好模型。
有偏估计量。
（5）a2的方差（
µ2 ）是真实估计量b 的有偏估计量。
x22
2
（6）置信区间和假设检验不可靠。
2-6
2-7
2-8
2-9
2-10
7.4 包括不相关变量：“过度拟合”模型
Yi B1 B2 X 2i ui
（7-9）
Yi A1 A2 X 2i A3 X 3i vi （7-10）
2.估计的 t 值
3.与先验预期相比，估计系数的符号
2-20
（7.7.2）对遗漏变量和不正确函数形式的检验
2-21
判定模型是否恰当主要根据以下一些参数：
1. R2和校正后的 R（2 R 2）
2.估计的 t 值
3.与先验预期相比，估计系数的符号
2-22
残差检验
残差图可以显示模型的设定误差，比如遗漏了变量或者是使用了不正确的模型形式。还可以诊断异方差和自相关。
如果研究者由于某种原因在模型构建过程中遗漏了一个或者几个变量，对OLS估计会有什么影响？例如将模型
Yi B1 B2 X 2i B3 X3i u（i 7-1）
误写成 Yi A1 A2 X2t v（t 7-2）
2-4
（1）如果遗漏的变量X3与X2相关，则a1和a2是有偏的，即 E(a1) B1 E(a2 ) B2

e商务文档

第7章模型选择：标准与检验

相关文档推荐：