第7章 模型选择标准与检验
a2
X 2t X 2
Yt
2
X 2t X 2
X 2t X 2 B1 B2 X 2t B3 X 3t ut
2
X 2t X 2
B1
X 2t X 2 B2
X 2t X 2 X 2t B3 X 2t X 2 X 3t
2
X 2t X 2
X 2t X 2 ut
(1)
Y:进口支出
X:个人可支配收入(PDI)
t:时间或趋势变量,取值1,…,20代表1968~1987年。
Yt=A1+A2Xt+vt
(2)
数据(ex610.dta)
reg t x 即b32=0.0173>0
首先估计模型1(即真实模型) 然后估计模型2(遗漏变量模型)
遗漏相关变量的后果:例子
对比
B2 B3
X 2t X 2
X 3t
2
X 2t X 2
X 2t X 2 ut
2
X 2t X 2
遗漏相关变量的后果
a2 B2 B3
X2t X2
X 3t
2
X2t X2
X 2t X 2 ut
2
X2t X2
(1)和如a果2是遗有漏偏的的变。量X3与模型中的变量X2相关,则a1 E(a2)=B2+B3b32, b32= cov(X2,X3)/var(X2)
a2
x32t x2t yt x22t x32t
x2t x3t
x3t yt
2
,
x2t x3t
将Yt B1 B2 X 2t ut代入上式,整理得
a2 =B2 +
x32t x2tut x22t x32t
x2t x3t x3tut
2
x2t x3t
所以,E a2 B2
加入多余变量
第7章 模型选择:标准 与检验
Model specification: criteria and tests
主要内容
“好的”或者“正确的”模型有那些性质,如何 确定模型形式是否正确?
在实际研究过程中,可能存在什么样的模型设定 问题?
设定误差会造成什么后果? 如何论断设定误差? 如何补救?
模型好坏的判断标准
不正确的函数形式
考虑模型(例7.3)
Yt=B1+B2X2t+B3X3t支配收入(PDI) X3:时间或趋势变量,取值1,…,20代表1968~1987年。
sˆ 2
e2
Y a1 a2 X 2 2
n2
n2
真实的误差方差估计量应为
sˆ 2
e2
Y b1 b2 X 2 b3 X 3 2
n3
n3
遗漏相关变量的后果
(5)估计量a2的方差是真实估计量b2方差的有偏估计量。 即使X2和X3不相关,这一偏误也不能消除。
即使X2和X3不相关,可以证明
E a1 B1 B3 X3 b32 X2
(2)不a1会和消a2不失是。一致的,无论样本容量有多大,偏差
(3)偏如的果和X2一和致X的3不。相但关a,1仍即然co是v(有X2偏,X的3)=。0,则a2是无
遗漏相关变量的后果
(4)根据模型(2)估计的误差项的方差是真实误差方差s2 的有偏估计量。
符合经济理论的预测。 预测能力(predictive power):
模型设定误差的类型
遗漏相关变量(omitted variables) 加入多余变量(irrelevant variables) 不正确的函数形式(misspecifications) 度量误差(measurement errors)
E
var
a2
var
b2
B32
n 2
x32t x22t
var b2
即,遗漏变量使var(a2)高估了真实值b2的方差。 如果X2和X3相关,则var(a2)会低估真实值b2的方差。
(6)因此,通常的置信区间和假设检验过程也不再可靠。
遗漏相关变量的后果:例子
美国进口支出函数分析
Yt=B1+B2Xt+B3t3t+ut
误差。从而对应的t检验值变大。从而更容易拒绝 原假设。
加入多余变量(irrelevant variables)
考虑真实模型
Yt=B1+B2X2t+ut
(3)
估计时设定模型形式为
Yt=A1+A2X2t+A3X3t+vt
(4)
根据经济理论,X3不应加入模型
加入多余变量
(1)错误设定模型2参数的估计量仍然是无偏的和 一致的。即E(a1)=B1, E(a2)=B2, E(a3)=0.
(1)错误设定模型表明,个人可支配收入每增加1美元,
进E费(a口倾2)支向=BB出22+。将B增3b3加2<约B20,即.25错美误元设。定b3模=-型23会.19低5<估0边, b际32>消0,
(2)截距也有偏差 (3)误差项的方差的估计量有偏:真实的为184,错误
设定估计的为475。 由于变量x和t相关,所以错误模型2会低估系数的标准
计量经济学家Harvey提出下面几个标准:
简约性(parsimony):简单优于复杂。 可识别性(identifiability):给定数据,参数的估计具有
惟一性。 拟合优度(goodness of fit):模型对数据的解释力。 理论一致性(theoretical consistency):估计的参数要
遗漏相关变量(omitted variables)
考虑真实模型(例13.1)
Yt=B1+B2X2t+B3X3t+ut
(1)
Y:进口支出
X2:个人可支配收入(PDI) X3:时间或趋势变量,取值1,…,20代表1968~1987年。
估计时设定模型形式为
Yt=A1+A2X2t+vt
(2)
遗漏相关变量的后果
(2)利用错误设定模型(4)估计的误差方差仍然是 正确的估计值。
(3)E[var(a2)]=var(b2), 即模型(4)的估计量的方差 仍然是真实估计量方差的无偏估计量。从而, 通常的t检验和F检验仍然有效。
(4)但是一般情况下,var(a2)>var(b2),除非加入 的多余变量X3与X2不相关。
也就是说,加入多余变量,OLS估计量仍然是线 性无偏的估计量,但不是BLUE估计量。
加入多余变量:例子
研发费用与销售额的关系 真实模型
rdexp= B1+B2sales+u rdexp研发费用支出 sales销售额
错误模型
rdexp= A1+A2sales+A3sales2+ v
先估计真实模型(3) 再估计错误模型(4)