内生性工具变量与GMM估计
(1/n)(Yt –b0,IV – Xtb1,IV) =0 (1/n)Zt(Yt –b0,IV – Xtb1,IV) =0
(对应E(t)=0) (对应E(Ztt)=0)
解得:
.
对于矩阵形式: Y=X+ 如果E(X’)0,(假设Xk与随机项相关),用工具变量Z替代 X(如用Zk替代Xk):
得到总体矩条件E(Z’)=0
假设模型为 Yt=0+1Xt1+2Yt-1+t=Xt*’+t 但 t中包含了一个与Xt1同期相关另一变量X2t: t=Xt2+ut 这时,X1的严格外生性不满足,它与t的同期不相关性也 不满足。
如,当设定如下工资方程时: lnWaget=0+1educt+ut
一个重要的影响因素“能力”被遗漏了,而“能力”与“受教 育程度”往往有较强的相关性。
对模型 Yt=0+1Xt1+…+kXtk+t
或 Y中一个重要的假设是“严格外生性”:
E(|X)=0 严格外生性(strictly exogeneity)的含义是:各期的解释 变量Xt独立于所有期的随机扰动项t 。
在严格外生性与球型假设下,OLS估计量是BLUE。这两 大假设也称为Yt或t是独立同分布的(iid)。
采用工具变量Z得到:
而OLS估计量
因此,尽管Corr(Z, ) 较小,而Corr(Z,X) 更小时,可能出现 Corr(Z, ) /Corr(Z,X)>Corr(X, )
从而有: bIV比bOLS偏差更大(. 更不具有一致性)。
例(内生性问题,Monte Carlo 实验)对Keynsians模型
.
总体矩M可以简单地定义为一随机变量X的某个连 续函数g 的数学期望:
M=E[g(X)] 例:对于总体均值,=E(X),这时g(X)=X
对于总体方差,2=E(X-)2,这时g(X)=(X-)2 总体均值称为总体的1阶原点矩,总体方差称为总体 的2阶中心矩。
根据类比法的原理,可以用样本矩(或样本矩函数) 来估计总体矩(或总体矩函数),而且,样本矩在大 样本下往往具有一致性。这一类比法也称为矩法。
则相应的样本矩条件为:(1/n)Z’(Y-Xb)=0
或
Z’Xb=Z’Y
由于Z与X的列相同L=K,Z’X满秩,解为:
bIV=(Z’X)-1Z’Y
注意:工具变量矩阵中所含的模型已有的外生解释变量可
看成自己的工具变量。
.
• 工具的选择
理论上,Z中保留了X中所有被认为是外生的且与随机扰动项 无关的变量,而那些内生的与随机扰动项相关的变量被工具 (变量)所取代。
.
2、出现同期相关OLS估计的后果 Question: What will happen if E(t|Xt)=0 fails?
假设有一元模型 Yt=0+1Xt+t 出现Xt与t的同期相关性:Cov(Xt,t)=E(Xtt)0
将原模型Yt代入上式得:
于是:Plim(b1)= 1+ Cov(Xt,t)/Var(Xt)1 后果:OLS估计量不一致,(当然也是有偏的)。
根据矩法(类比法),相应的样本矩为:
m()= (1/n)X’(Y-Xb)
问题归结为,寻找适当的b,使得 m(b)=0
或:
(1/n)X’(Y-Xb)=0
解为:
b=(X’X)-1X’Y
.
二、矩估计中的工具变量(IV)法 假设有如下模型: Yt=Xt1’1 +Xt22+t 其中:X2为单一变量,X1为包括截距项的k维行向量
E(Xt*ut)=E(Xt+vt)ut]=E(Xtut)+E(vtut) =E(Xtt)- 1E(Xtvt)+E(tvt) -1E(vt2) =-1v20
问题:如果X可观测,而Y不可. 观测,情况如何?
• 情形4. 联立方程偏误
设有如下简单的Keynsian模型 Ct=0+1Yt+t Yt=Ct+It
但在应用研究中,这样的工具变量Z很难找到:一般 找到的工具变量往往是: (1)与随机扰动项有轻度相关,(2)与解释变量X也 是轻度相关
当工具变量Z与解释变量有轻度相关性时,称之为弱工具 变量(weak IV)。
在弱工具变量情形下,IV估计可能会带来比OLS估计 量更严重的不一致性
.
对一元模型 Yt=0+1Xt+t 出现Xt与t的同期相关性时:Cov(Xt,t)=E(Xtt)0
(**)
下面证明 2 (XX)-1 =2plim(n-1X’X)-1是最小的渐近方差。
只需证明,对任意n>N,X’X与其他估计的方差之差为半 正定矩阵。
对任意可行的Z,相应的bIV的渐近方差为 (1/n)2plim [n-1X’Z(Z’Z)-1Z’X]-1=(1/n)2plim [n-1X’PZX)]-1
另一方面,由于 E[Ztt]=0,由中心极限定理: 而 Var(Ztt)=E(t2ZtZt’)=E[E(t2ZtZt’|Zt)]=E[ZtZt’E(t2 |Zt)]
= 2E(ZtZt’) = 2ZZ
.
3、IV估计量不具有渐近有效性
Z的不同取法,都可得到参数的一致估计,但渐近方差不 同。
当取Z=X时,bIV具有最小的渐近方差。
.
• 情形3:存在测量误差
假设模型 Yt=0+1Xt+t
假设收集不到Xt的精确观测值,收集到的Xt*包含了测量误
差vt:
Xt*= Xt+vt
由于实际估计的是如下可观测变量的回归模型: Yt=0+1Xt*+ut
于是: ut=Yt- 0-1Xt*= [0+1Xt+t]-0-1(Xt+vt) = t - 1vt
第8章 内生性、工具变量与 GMM估计
•外生性与常见的内生性问题 •矩估计(MM)与工具变量法(IV) •线性模型的两阶段最小二乘估计(2SLS) •线性模型的广义矩估计(GMM)
.
§8.1 外生性与常见的内生性问题
一、外生性假设与内生性问题 二、常见的内生性
.
一、外生性假设与内生性问题
1、外生性与OLS估计量的统计性质
bIV=(ZtXt’)-1ZtYt=(Z’X)-1(Z’Y)
.
例:一元回归例
假设有一元模型 Yt=0+1Xt+t 出现Xt与t的同期相关性:Cov(Xt,t)=E(Xtt)0
这时,寻找一工具变量Z,满足Cov(Zt, t)=E(Ztt)=0, Cov(Zt,Xt)0。使得原模型的矩条件变为
E(Ztt)=0 相应的样本矩方程组为
于是: X’X-X’PZX=X’MZX =(MZX)’(MZX)=半正定矩阵
这也简接证明了第4章中曾指出的如下一类估计量的渐近有效性
gj(X)=Zj时,即为 IV估计
gj(X)=Xj时, 即为OLS估
计
.
4、弱工具变量带来的估计偏误
工具变量Z要求:(1)与随机扰动项不相关,(2) 与解释变量X高度相关
.
如果X的严格外生性不满足,则需假设Xt与t的同期无关 性(contemporaneously uncorrelated):
E(t|Xt)=0 且 t~iid(0, 2)
XX= Plim(X’X/n) =E(XtXt’)
E(t|Xt)=0称为解释变量与随机扰动项同期无关。或称Xt为外 生的(exogenous),否则,称为同期相关或内生的(endogenous)
如果缺少矩条件,如E(Xt2t)0,则上述正规 方程组最后一个方程不存在,则无法求解。
.
这时,如果能寻找一工具变量Z2,满足Cov(Zt2, t) =E(Zt2t)=0,Cov(Zt2,Xt2)0。使得原模型的矩条件变为
E(Xt1t)=0, E(Zt2t)=0 相应的样本矩方程组为
(1/n)Xt1(Yt –Xt1’b1,IV –Xt2b2,IV) =0 (1/n)Zt2(Yt –Xt1’b1,IV –Xt2b2,IV) =0
2、1为对应的参数变量与参数向量。 如果模型设定正确,则有如下总体矩条件
E(Xt1t )=0, E(Xt2t)=0
(1/n)Xt1(Yt-Xt1’b1-Xt2b2) =0 (1/n)Xt2(Yt-Xt1’b1-Xt2b2) =0
.
正规方程组 (1/n)Xt1(Yt-Xt1’b1-Xt2b2) =0 (1/n)Xt2(Yt-Xt1’b1-Xt2b2) =0
EX*tt
E(t) E(Xtt)
0 0
E(Yt1t) E(Yt1t1)
E(Yt-1t-1) 0
注意: (1)如果t不存在自相关,则E(Xt*t)=0,但有 E(Xt+1*t) 0,即不存在同期相关,只存在异期相关。
问题:如果t只存在2阶自相关. ,情形会如何?
• 情形2:存在遗漏变量,且遗漏变量与解释变量相关
.
§8.2 矩估计与工具变量法
一、矩估计 二、矩估计中的工具变量法 三、工具变量法的统计性质 四、弱工具变量带来的估计偏误
.
一、矩估计
内生性的核心问题是 E(t|Xt) 0,而工具变量法 则是寻找一组工具变量Z,满足 E(t|Zt) = 0,并按矩 估计的思想来进行参数估计的。
1、矩估计(Method of Moment, MM) 矩估计是一种类比方法,该方法从总体具有的某 些固有的特征(总体矩)出发,认为如果样本是从某 总体中抽出的,则样本也应具有类似的特征(样本 矩),从而通过计算样本的相关特征,寻找总体参 数的估计。
其中,Yt、Ct、It分别表示国民收入、消费与投资。Ct、Yt也 称为模型的内生变量(endogenous variables),It称为外生变量 (exogenous variable)。