当前位置:
文档之家› 工具变量(IV):估计与检验
工具变量(IV):估计与检验
用到 i E zi x 为对称矩阵
-1
秩条件r i E zi x =k意味着工具变量w i与内生解释 变量x i相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数 2 恰好识别:工具变量个数等于内生解释变量个数 3 过度识别:工具变量个数多于内生解释变量个数
解释变量内生性检验
Hausman 检验
寻找工具变量的方法:几个实例
方法 例子
由来
经典假设 所有的解释变量Xi与随机误差项彼此 之间不相关。
Cov (u i , X i ) 0
若解释变量Xi和ui相关,则OLS估计量是非一致 的,也就是即使当样本容量很大时,OLS估计量 也不会接近回归系数的真值。 造成误差项与回归变量相关(内生性)的原因 很多,但我们主要考虑如下几个方面: • 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
1、矩估计(Method of Moments,MM)
首先以一个例子来说明矩估计方法:假设随机变量 x N , 2 ,其中, 2为待估参数。因为有两 个待估参数,故需要使用以下两个总体矩条件: 一阶中心矩:E x =
2 2 二阶中心矩:E x =Var x + E x = + 2 2
可以引入工具变量w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即 Cov w t,p t 0,p t为内生解释变量 (2)外生性:工具变量与扰动项不相关,即 Cov w t, t =0
二、工具变量法作为一种矩估计
2、工具变量法作为一种矩估计
假设回归模型为 yi=1x i1+ + k-1x i,k-1+ k x ik+ i 假设只有最后一个解释变量x ik为内生变量,即 Cov x ik, i 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov x ik,w i 0 (相关性),以及Cov w i, i =(外生性)。由于 0 x1, ,x k-1不是内生变量,故可以把自己作为自己 的工具变量(因为满足工具变量的两个条件)
-1
E i x i yi-x =0
= i i 可逆) E x i x E x i yi (假设E x i x
以样本矩替代上式中的总体矩,即可得到矩估计:
n 1 1 -1 ˆ ˆ MM= x i x x y = X X X y = i i i OLS n i=1 n i=1 显然这就是OLS估计量 n -1
3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
我们的工作就是要寻找相应的工具变量将解 释变量分解成内生变量和外生变量,然后利 用两阶段最小二乘法(TSLS)进行估计。 一个例子:考虑货币政策对宏观经济的影响。 由于货币政策的制定者会根据宏观经济的运 行情况来调整货币政策,故货币政策是个内 生变量(双向因果关系)。Romer (2004) 通过阅读历史文献将货币政策的变动分解为 “内生”(对经济的反应)与“外生”(货 币当局的自主调整)的两部分。
上图表明若某个变量使供给曲线移动而使需求保待不 变时会发生什么样的情况。现在所有的均衡价格和均 衡量对都落在这条稳定的需求曲线
工具变量法的本质是联立方程,只不过 ,我们只关心原方程的可识别性
估计:矩估计、TSLS、GMM、LIML
一、工具变量法(Instrumental Variable,IV)
以上介绍的矩估计法仅适用于恰好识别的情况。 在过度识别的情况下,ZX不是方阵, ZX 不存在
-1
ˆ 。 无法得到工具变量估计量 IV
若扔掉多余的工具变量将会浪费有用的信息,有效 的方法是二阶段最小二乘法
三、二阶段最小二乘法
显然,多个工具变量的线性组合仍然是工具变量 因为仍满足工具变量的两个条件(相关性与外生性) 如果生成工具变量的k个线性组合,则又回到恰好 识别的情形。那么什么样的线性组合才是最有效率 的呢?可以证明在球形扰动项的假设下,由二阶段 最小二乘法(2SLS)所提供的工具变量线性组合是 所有线性组合中最渐近有效的。这个结论类似于小 样本理论中的高斯-马尔可夫定理。
用对应的样本矩来替代总体矩条件可得以下联立 方程组,求解后即得到期望与方差的矩估计:
1 n ˆ ˆ=x n x i= i=1 2 1 n 2 n ˆ = x i-x 2 2 1 x 2= ˆ + ˆ n i=1 i n i=1 1 n 其中,x= x i为样本均值,上面推导中用到: n i=1
-1
E z x i i E g i =0
-1 =0
其中SZX
1 n 1 n zi x z i i i,g n i=1 n i=1
与第三章大样本最小二乘法类似的假定和推导,
d 可以证明,ng N 0,S, 2 其中S E gi g = E i zi zi i
n 1 1 -1 ˆ IV= zi x zi yi = ZX Zy i n i=1 n i=1 n -1
其中,Z z1
z n-1 z n 即Z z1
z n-1 z n
下面是工具变量法的大样本性质:
定理:若秩条件r i i 满 E zi x =k成立(方阵E zi x ˆ 是的一致估计 秩),则在一定的正则条件下, IV ˆ 服从渐近正态分布 且
工具变量(instrumental variable, IV)回 归是当回归变量X与误差项u相关时获得总体 回归方程未知系数一致估计量的一般方法。 我们经常称其为IV估计。 其基本思想是:假设方程是:
我们假设ui与Xi相关,则OLS估计量一定是 有偏的和非一致的。工具变量估计是利用另 一个“工具”变量Z将Xi分离成与ui相关和 不相关的两部分。
E i zi yi-x =0
-1
由此可得E zi i =0
-1
E zi yi = i E zi x = i i E zi x E zi yi (假定 E zi x 存在)
以样本矩代替上式中的总体矩,即可得到工具变 量估计量:
2 2 x - x = x - nx i i 2 n n i=1 i=1
任何随机向量x的函数f x 的期望E f x 都被称为 总体矩。事实上,OLS也是一种矩估计。利用解释 变量与扰动项的正交性,可以得到以下总体矩条件
E x i i =0
E x i yi =E x i x i
在经济学中: (1)内生变量:由模型内的变量所决定 的变量称作内生变量。 (2)外生变量:由模型外的变量所决定 的变量称作外生变量。
重要概念:内生变量和外生变量
在计量经济学中,把所有与扰动项相关 的解释变量都称为“内生变量”。这与 一般经济学理论中的定义有所不同。 1。与误差项相关的变量称为内生变量 (endogenous variable)。 2。与误差项不相关的变量称为外生变量 (exogenous variable)。
谁开创了工具变量回归?
1928年的著作的“The Tariff on Animal and Vegetable Oils”的附录B。 作者是谁? Philip Wright 还是他的儿子 Sewall Wright 文体计量学的分析
为什么IV回归是有效的?
例1: Philip Wright的问题 Philip Wright关心的是那个时期的一个重要 经济问题:即如何对诸如黄油,大豆油这样的 动植物油和食用动物设置进口关税。在20世 纪20年代,进口关税是美国主要的税收收入 来源。而理解关税的经济效应的关键在于要有 商品需求和供给曲线的定量估计。由前知供给 弹性为价格上涨1%引起的供给量变化的百分 率,而需求弹性为价格上涨1%引起的需求量 的百分率变化。
工具变量回归
由来 估计
矩估计(不好) 2SLS (最常用) GMM(异方差自相关);LIML(若IV)
工具变量有效性检验
相关性 F检验; Partial R2,单内生解释变量Minimum eigenvalue statistic,最小特征值统计量,用于多内 生解释变量 外生性 过度识别约束检验 J统计量 (又称Sargan 统计量)
ˆ 渐近服从正态分布,即 进一步,工具变量估计量 IV
d ˆ - =S-1 ng ˆ ,其 n N 0 , AVar IV ZX IV -1 -1 ˆ 中渐近方差矩阵AVar IV = i i E zi x S E zi x
IV
-1 ˆ 证明:抽样误差 IV-= ZX Zy-
= ZX Z X+ -= ZX Z
-1 -1
1 1 n -1 p = zi x i zi i =SZX g n i=1 n i=1
n
记解释变量向量x i x i1 yi=x i + i zi zi1 zi,k-1 zik x i1
x i,k-1 x ik ,则原模型为 x i,k-1 w i 。
记工具变量向量为
定义gi zi i。由于工具向量与扰动项正交,故 E gi =E zi i =0为总体矩条件或正交条件