当前位置：文档之家› 第7章模型选择标准与检验

第7章模型选择标准与检验

a2
X 2t X 2
Yt
2
X 2t X 2
X 2t X 2 B1 B2 X 2t B3 X 3t ut
2
X 2t X 2
B1
X 2t X 2 B2
X 2t X 2 X 2t B3 X 2t X 2 X 3t
2
X 2t X 2
X 2t X 2 ut
(1)
Y：进口支出
X：个人可支配收入（PDI）
t：时间或趋势变量，取值1,…,20代表1968~1987年。
Yt=A1+A2Xt+vt
(2)
数据(ex610.dta)
reg t x 即b32=0.0173>0
首先估计模型1（即真实模型）然后估计模型2（遗漏变量模型）
遗漏相关变量的后果：例子
对比
B2 B3
X 2t X 2
X 3t
2
X 2t X 2
X 2t X 2 ut
2
X 2t X 2
遗漏相关变量的后果
a2 B2 B3
X2t X2
X 3t
2
X2t X2
X 2t X 2 ut
2
X2t X2
(1)和如a果2是遗有漏偏的的变。量X3与模型中的变量X2相关，则a1 E(a2)=B2+B3b32, b32= cov(X2,X3)/var(X2)
a2
x32t x2t yt x22t x32t
x2t x3t
x3t yt
2
,
x2t x3t
将Yt B1 B2 X 2t ut代入上式，整理得
a2 =B2 +
x32t x2tut x22t x32t
x2t x3t x3tut
2
x2t x3t
所以，E a2 B2
加入多余变量
第7章模型选择:标准与检验
Model specification: criteria and tests
主要内容
“好的”或者“正确的”模型有那些性质，如何确定模型形式是否正确？
在实际研究过程中，可能存在什么样的模型设定问题？
设定误差会造成什么后果？如何论断设定误差？如何补救？
模型好坏的判断标准
不正确的函数形式
考虑模型（例7.3）
Yt=B1+B2X2t+B3X3t支配收入（PDI） X3：时间或趋势变量，取值1,…,20代表1968~1987年。
sˆ 2
e2
Y a1 a2 X 2 2
n2
n2
真实的误差方差估计量应为
sˆ 2
e2
Y b1 b2 X 2 b3 X 3 2
n3
n3
遗漏相关变量的后果
(5)估计量a2的方差是真实估计量b2方差的有偏估计量。即使X2和X3不相关，这一偏误也不能消除。
即使X2和X3不相关，可以证明
E a1 B1 B3 X3 b32 X2
(2)不a1会和消a2不失是。一致的，无论样本容量有多大，偏差
(3)偏如的果和X2一和致X的3不。相但关a，1仍即然co是v(有X2偏,X的3)=。0，则a2是无
遗漏相关变量的后果
(4)根据模型(2)估计的误差项的方差是真实误差方差s2 的有偏估计量。
符合经济理论的预测。预测能力(predictive power)：
模型设定误差的类型
遗漏相关变量(omitted variables) 加入多余变量(irrelevant variables) 不正确的函数形式(misspecifications) 度量误差(measurement errors)
E
var
a2
var
b2
B32
n 2
x32t x22t
var b2
即，遗漏变量使var(a2)高估了真实值b2的方差。如果X2和X3相关，则var(a2)会低估真实值b2的方差。
(6)因此，通常的置信区间和假设检验过程也不再可靠。
遗漏相关变量的后果：例子
美国进口支出函数分析
Yt=B1+B2Xt+B3t3t+ut
误差。从而对应的t检验值变大。从而更容易拒绝原假设。
加入多余变量(irrelevant variables)
考虑真实模型
Yt=B1+B2X2t+ut
(3)
估计时设定模型形式为
Yt=A1+A2X2t+A3X3t+vt
(4)
根据经济理论，X3不应加入模型
加入多余变量
(1)错误设定模型2参数的估计量仍然是无偏的和一致的。即E(a1)=B1, E(a2)=B2, E(a3)=0.
(1)错误设定模型表明，个人可支配收入每增加1美元，
进E费(a口倾2)支向=BB出22+。将B增3b3加2<约B20,即.25错美误元设。定b3模=-型23会.19低5<估0边, b际32>消0,
(2)截距也有偏差 (3)误差项的方差的估计量有偏：真实的为184，错误
设定估计的为475。由于变量x和t相关，所以错误模型2会低估系数的标准
计量经济学家Harvey提出下面几个标准：
简约性(parsimony)：简单优于复杂。可识别性(identifiability)：给定数据，参数的估计具有
惟一性。拟合优度(goodness of fit)：模型对数据的解释力。理论一致性(theoretical consistency)：估计的参数要
遗漏相关变量(omitted variables)
考虑真实模型（例13.1）
Yt=B1+B2X2t+B3X3t+ut
(1)
Y：进口支出
X2：个人可支配收入（PDI） X3：时间或趋势变量，取值1,…,20代表1968~1987年。
估计时设定模型形式为
Yt=A1+A2X2t+vt
(2)
遗漏相关变量的后果
(2)利用错误设定模型(4)估计的误差方差仍然是正确的估计值。
(3)E[var(a2)]=var(b2), 即模型(4)的估计量的方差仍然是真实估计量方差的无偏估计量。从而，通常的t检验和F检验仍然有效。
(4)但是一般情况下，var(a2)>var(b2)，除非加入的多余变量X3与X2不相关。
也就是说，加入多余变量，OLS估计量仍然是线性无偏的估计量，但不是BLUE估计量。
加入多余变量:例子
研发费用与销售额的关系真实模型
rdexp= B1+B2sales+u rdexp研发费用支出 sales销售额
错误模型
rdexp= A1+A2sales+A3sales2+ v
先估计真实模型(3) 再估计错误模型(4)

e商务文档

第7章模型选择标准与检验

相关文档推荐：

e商务文档

第7章 模型选择标准与检验

相关文档推荐：

第7章模型选择标准与检验