当前位置:文档之家› 第十二讲 工具变量回归(1)

第十二讲 工具变量回归(1)


具体来说: 具体来说: 第一阶段: 分解成与X高度相关的外生变 第一阶段:将X分解成与 高度相关的外生变 分解成与 以及与干扰项u 量Z以及与干扰项 i相关的部分 i。 以及与干扰项 相关的部分v
为什么IV回归是有效的? 为什么 回归是有效的? 回归是有效的
例1: Philip Wright的问题 的问题 Philip Wright关心的是他那个时期的一个重要经济 关心的是他那个时期的一个重要经济 问题:即如何对诸如黄油, 问题:即如何对诸如黄油,大豆油这样的动植物油和 食用动物设置进口关税。 世纪20年代 食用动物设置进口关税。在20世纪 年代,进口关 世纪 年代, 税是美国主要的税收收入来源。 税是美国主要的税收收入来源。而理解关税的经济效 应的关键在于要有商品需求和供给曲线的定量估计。 应的关键在于要有商品需求和供给曲线的定量估计。 由前知供给弹性为价格上涨1%引起的供给量变化的 由前知供给弹性为价格上涨 引起的供给量变化的 百分率,而需求弹性为价格上涨1%引起的需求量的 百分率,而需求弹性为价格上涨 引起的需求量的 百分率变化。 百分率变化。Philip Wright就需要这些供给和需求 就需要这些供给和需求 弹性的估计。 弹性的估计。
(2)工具变量外生性:工具变量与随机误差 )工具变量外生性: 项不相关; 项不相关;
Cov(ui, Zi) = 0
两阶段最小二乘估计量
若工具变量Z满足工具变量相关性和外生性 若工具变量 满足工具变量相关性和外生性 的条件,则可用称为两阶段最小二乘 两阶段最小二乘(TSLS) 的条件,则可用称为两阶段最小二乘 估计量估计系数ß 的IV估计量估计系数ß1。 估计量估计系数 两阶段最小二乘估计量分两阶段计算: 两阶段最小二乘估计量分两阶段计算: 第一阶段把 分解成两部分 分解成两部分: 第一阶段把X分解成两部分:即与回归误差 项相关的会引发问题的一部分以及与误差项 无关的不会引发问题的一部分。 无关的不会引发问题的一部分。 第二阶段是利用与误差项无关的那部分进行 第二阶段是利用与误差项无关的那部分进行 估计。 估计。
在计量经济学中,把所有与扰动项相关的解释 在计量经济学中, 变量都称为“内生变量” 变量都称为“内生变量”。这与一般经济学理 论中的定义有所不同。 论中的定义有所不同。 因此在工具变量回归中有特定术语来区分与总 体误差项相关和不相关的变量: 体误差项相关和不相关的变量: 1。其中与误差项相关的变量称为内生变量 。其中与误差项相关的变量称为内生变量 (endogenous variable)。 。 2。而与误差项不相关的变量称为外生变量 。而与误差项不相关的变量称为外生变量 (exogenous variable)。 。
Wright的解决办法: 的解决办法: 的解决办法 1。找到第三个变量,这个变量影响供给但不 。找到第三个变量, 影响需求。这样, 影响需求。这样,所有的均衡价格和均衡量对 都落在这条稳定的需求曲线上, 都落在这条稳定的需求曲线上,此时很容易估 计出它的斜率。 计出它的斜率。 2。可见,这第三个变量,也就是工具变量, 。可见,这第三个变量,也就是工具变量, 它与价格相关(它使供给曲线移动 它使供给曲线移动, 它与价格相关 它使供给曲线移动,于是导致 价格发生变化),但与u无关 无关(需求曲线保持不 价格发生变化 ,但与 无关 需的方法
使用工具变量法的前提是存在有效的工具变 因此, 量。因此,如果寻找工具变量在实践中十分 重要。由于工具变量的两个要求( 相关性” 重要。由于工具变量的两个要求(“相关性” 外生性” 常常是自相矛盾的, 与“外生性”)常常是自相矛盾的,即与内 生解释变量相关的变量常常与被解释变量的 扰动项也相关。 扰动项也相关。故在实践上寻找合适的工具 变量常常比较困难, 变量常常比较困难,有时需要一定的创造性 与想象力。 与想象力。
例如具休考虑黄油的需求弹性估计问题: 例如具休考虑黄油的需求弹性估计问题:
根据11个均衡样本点估计的方程究竟是需求函数还是 根据 个均衡样本点估计的方程究竟是需求函数还是 供给函数?两者都不是。 供给函数?两者都不是。由于这些点是由需求和供给 两者的变化确定的,因此用OLS拟合这些点的直线既 两者的变化确定的,因此用 拟合这些点的直线既 不是需求曲线也不是供给曲线的估计。 不是需求曲线也不是供给曲线的估计。
工具变量问归提供了解决这一问题的另一种 方法。考虑下面的假想例子: 方法。考虑下面的假想例子:由于夏天发生 了地震,为了进行灾后修复工作, 了地震,为了进行灾后修复工作,必须关闭 某些加利福尼亚州的学校。 某些加利福尼亚州的学校。而最靠近震中的 地区受到的影响最严重。 地区受到的影响最严重。于是有学校关闭的 地区需要把学生“挤在一起” 地区需要把学生“挤在一起”,因此暂时扩 大了班级规模。这意味着到震中的距离 到震中的距离与班 大了班级规模。这意味着到震中的距离与班 级规模相关, 级规模相关,故它满足工具变最相关性的条 件但如果到震中的距离与其他影响学生成绩 的因素无关(如学生是否还在学习英语 如学生是否还在学习英语), 的因素无关 如学生是否还在学习英语 ,则 由于它与误差项无关因此是外生的。 由于它与误差项无关因此是外生的。于是到 震中的距离这个工具变量可以用来避免遗漏 变量偏差和估计班级规模对测试成绩的效应。 变量偏差和估计班级规模对测试成绩的效应。
3。Wright考虑了儿个可能的工具变量; 。 考虑了儿个可能的工具变量; 考虑了儿个可能的工具变量 其中一个是天气。例如,某牧场的降雨量 降雨量低 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 黄油的产量 会使供给曲线向左移动而使均 衡价格上升), 衡价格上升 ,因此牧场地区降雨量满足工 具变量相关性的条件。 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响, 黄油的需求没有直接影响,因此牧场地区降 雨量与u 的相关系数为零; 雨量与 i的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。 降雨量满足工具变量外生性条件。
我们的工作就是要寻找相应的工具变量将解 我们的工作就是要寻找相应的工具变量将解 工具变量 释变量分解成内生变量和外生变量, 释变量分解成内生变量和外生变量,然后利 两阶段最小二乘法(TSLS)进行估计。 进行估计。 用两阶段最小二乘法 进行估计 一个例子:考虑货币政策对宏观经济的影响。 一个例子:考虑货币政策对宏观经济的影响。 由于货币政策的制定者会根据宏观经济的运 行情况来调整货币政策, 行情况来调整货币政策,故货币政策是个内 生变量(双向因果关系)。 )。Romer (2004) 生变量(双向因果关系)。 通过阅读历史文献将货币政策的变动分解为 内生” 对经济的反应) 外生” “内生”(对经济的反应)与“外生”(货 币当局的自主调整)的两部分。 币当局的自主调整)的两部分。
工具变量(instrumental variable, IV)回 工具变量 回 归是当回归变量X与误差项 与误差项u相关时获得总体 归是当回归变量 与误差项 相关时获得总体 回归方程未知系数一致估计量的一般方法。 回归方程未知系数一致估计量的一般方法。 估计。 我们经常称其为IV估计 我们经常称其为 估计。 基本思想是 假设方程是: 其基本思想是:假设方程是:
寻找工具变量的步骤大致可以分为两步, 寻找工具变量的步骤大致可以分为两步, (i)列出与内生解释变量(x)相关的 )列出与内生解释变量( 尽可能多的变量的清单( 尽可能多的变量的清单(这一步较容 易); (ii)从这一清单中剔除与扰动项相关的 ) 变量(这一步较难)。 变量(这一步较难)。
例:警力与犯罪率。一般认为,警察人 警力与犯罪率。一般认为, 数越多,执法力度越大, 数越多,执法力度越大,则犯罪率应该 越低。为了度量警力对犯罪率的作用, 越低。为了度量警力对犯罪率的作用, 如果直接把犯罪率对警察人数进行回归, 如果直接把犯罪率对警察人数进行回归, 就会出现“内生变量偏差” 这是因为, 就会出现“内生变量偏差”。这是因为, 警察人数其实是一个内生变量,比如, 警察人数其实是一个内生变量,比如, 某个城市的犯罪率很高, 某个城市的犯罪率很高,则市政府通常 会扩大警力规模。 会扩大警力规模。
工具变量回归
假设4 所有的解释变量Xi与随机误差项彼此之 假设4 所有的解释变量X
间不相关。 间不相关。
Cov(ui, Xi) = 0
若解释变量X 相关, 若解释变量 i和ui相关,则OLS估计量是非 估计量是非 一致的,也就是即使当样本容量很大时, 一致的,也就是即使当样本容量很大时, OLS估计量也不会接近回归系数的真值。 估计量也不会接近回归系数的真值。 估计量也不会接近回归系数的真值
误差项与回归变量相关:遗漏变量变量、 误差项与回归变量相关:遗漏变量变量、变 量有测量误差和双向因果关系。 量有测量误差和双向因果关系。 遗漏变量偏差可采用在多元回归中加入遗漏 遗漏变量偏差可采用在多元回归中加入遗漏 变量的方法加以解决, 变量的方法加以解决,但前提是只有当你有 遗漏变量数据时上述方法才可行。 遗漏变量数据时上述方法才可行。 双向因果关系偏差是指如果有时因果关系是 双向因果关系偏差是指如果有时因果关系是 又从Y到 时 从X到Y又从 到X时,此时仅用多元回归无法 到 又从 消除这一偏差。同样, 消除这一偏差。同样, 变量有测量误差也无法用我们前面学过的方 变量有测量误差也无法用我们前面学过的方 法解决。 法解决。 因此我们就必须寻找一种新的方法。 因此我们就必须寻找一种新的方法。
上图表明若某个变量使供给曲线移动而使需求保待 不变时会发生什么样的情况。 不变时会发生什么样的情况。现在所有的均衡价格 和均衡量对都落在这条稳定的需求曲线
例2:班级模型对测试成缓的效应估计 : 尽管控制了学生和地区特征, 尽管控制了学生和地区特征,但由于受诸如 校外学习机会或教师质量等不可测变量的影响. 校外学习机会或教师质量等不可测变量的影响 第二篇中给出的班级规模对测试成绩的效应估 计中仍然可能存在着遗漏变量偏差。 计中仍然可能存在着遗漏变量偏差。若这些变 量的数据不可得, 量的数据不可得,则不能通过在多元回归中加 入这些变量的方法来处理遗漏变量偏差。 入这些变量的方法来处理遗漏变量偏差。
相关主题