工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
工具变量,顾名思义是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关的随机解释变量(即内生变量)。
满足条件:1)总体无关:工具变量与随机扰动项无关;2)样本相关:工具变量必须与被它所代替的内生变量高度相关;3)与模型中其他解释变量不相关,以避免出现多重共线性。
做了替代后,用普通最小二乘法即可得到原回归系数的一致估计量。
二、工具变量法的基本原理我们分别从简单线性回归模型和多元线性回归模型两方面来具体分析工具变量法的基本原理:简单线性回归模型考虑简单线性回归模型()122 1,2,,i i i Y X u n ββ=++ ()其中2i X 为内生变量。
则其正规方程为:112010i i i i i X u X X u ∧∧⎧=⎪≡⎨⎪=⎩∑∑ () 设回归模型中的解释变量与随机扰动项相关,则如前所述,普通最小二乘估计量是非一致的。
现用一个工具变量i Z 来代替正规方程中的解释变量2i X ,其残差表达式不变。
11010i i i i i X u X Z u ∧∧⎧=⎪≡⎨⎪=⎩∑∑ () 即:112211220 10i i i i i i i X Y X X Z Y X ββββ∧∧∧∧⎧⎛⎫--= ⎪⎪⎪⎝⎭≡⎨⎛⎫⎪--= ⎪⎪⎝⎭⎩∑∑ () 解上述引入了工具变量后的正规方程可得斜率项系数的估计量为:22i i IV i iz y z xβ∧=∑∑ ()()式中小写字母代表相应大写字母的离差。
该市所表示的估计量就是工具变量估计量,简称IV 估计量,用β∧IV 表示。
易证IV 估计量是一致估计量。
事实上,()2222222iiii i i i IVi ii ii iz y z xu z u z xz xz xβββ∧+===+∑∑∑∑∑∑ () 若工具变量与解释变量高度相关,则表明()式中2∑i i z x 较大;若工具变量与随机扰动项渐近无关,则表明()式中∑i i z u 随着样本容量的增加而趋向于零。
故在工具变量与它相应的解释变量高度相关而与随机扰动项渐近无关的条件下,有2222lim lim lim i iIV i ip z u p p z x βββ∧=+=∑∑ ()样本估计总体,()表明IV 估计量是一致估计量。
多元线性回归模型:工具变量法可直接推广到多元线性回归模型()1122 1,2,,i i i k ki i Y X X X u i n βββ=++++= ()其中:11i X ≡在讨论工具变量法在多元线性回归模型中的应用之前,我们先来分析工具变量的个数问题。
为了一般起见,当解释变量与随机扰动项不相关时,我们把解释变量本身也作为是一个工具变量。
这就是说,在我们的模型中凡事预随机扰动项无关或渐近无关而与解释变量相关的变量都称为是工具变量。
这样与随机扰动项无关的解释变量本身当然是与解释变量高度相关的变量,故它也是工具变量。
在作了这样的约定之后对多元回归模型()来说,工具变量的个数一定不会小于解释变量(包括常数项)的个数(但可以大于解释变量的个数)。
这是因为凡是与随机扰动项相关的解释变量都要有与随机扰动项无关或者渐近无关的工具变量或工具变量的线性组合,而凡与随机扰动项无关的解释变量本身就是一个工具变量(按我们上述约定)。
所以工具变量的个数当然不小于解释变量(包含常数项)的个数。
因此:工具变量的个数可以等于也可以大于(但不能小于)解释变量(包括常数项)的个数。
接下来的分析中,我们重点讨论工具变量的个数与解释变量的个数相等的情形:对于多元线性回归模型():设解释变量,(1,2,,)j X j k =的工具变量为,(1,2,,)j Z j k =,其中111Z X ≡≡,而且某些Z 变量可能与X 变量相同。
若多元线性回归模型()的正规方程为:12ˆ0ˆ0ˆ0i i i iki i X u X u X u ⎧=⎪=⎪⎨⎪⎪=⎩∑∑∑ () 则可通过将这个正规方程组中的解释变量换成其相应的工具变量,但残差的形式保持不变。
得:12ˆ0ˆ0ˆ0i i i iki i Z u Z u Z u ⎧=⎪=⎪⎨⎪⎪=⎩∑∑∑ 解方程组()可得回归系数的一致估计量即IV 估计量。
将1ˆˆkii j ji ju Y X β==-∑ 代入()式中,经整理得: 1111122111111ˆ=ˆ=ˆ=k nnj i ji i i j i ik nnj i ji i ij ii k nnj ki ji ki i j i iZ X Z Y Z X Z Y Z X Z Y βββ=========⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩∑∑∑∑∑∑∑∑∑ ()若令112111222212k k n nkn Z Z Z Z Z Z Z Z Z Z ⎧⎫⎪⎪⎪⎪=⎨⎬⎪⎪⎪⎪⎩⎭ ,112111222212k k nnkn X X X X X X X X X X ⎧⎫⎪⎪⎪⎪=⎨⎬⎪⎪⎪⎪⎩⎭,12ˆˆˆˆk ββββ⎧⎫⎪⎪⎪⎪=⎨⎬⎪⎪⎪⎪⎩⎭,12n Y Y Y Y ⎧⎫⎪⎪⎪⎪=⎨⎬⎪⎪⎪⎪⎩⎭则()式可以表示为:,,ˆZ X Z Y β= ()若,Z X 是一个满秩矩阵,则回归系数的IV 估计量为:,1,ˆ()IVZ X Z Y β-= () 当解释变量与随机扰动项不相关时,我们把这个解释变量本身也作为是一个工具变量。
把模型中凡是与随机扰动项无关或渐进无关而与解释变量相关的变量都称为解释变量。
工具变量的个数一定不会小于解释变量(包括常数项)的个数。
三、二阶段最小二乘法(TLS )IV 估计量可以看作是两次运用最小二乘法的结果。
第一阶段:求解释变量X 对工具变量Z 的回归,得到一个解释变量的拟合值X ∧。
()1''Z X Z Z Z Z X P X∧-== ()第二阶段:求应变量Y 对解释变量的拟合值X ∧的回归,得到回归系数的估计值。
()11''''''β-∧∧∧∧-⎛⎫== ⎪⎝⎭TLSz z Z X X X Y X P P X X P Y ()注意到Z P 为一对称的幂等矩阵,所以,()1'''ββ∧∧-==TLS IV z ZX P X X P Y ()二阶段最小二乘法(TLS )简例122334455 i i i i i i Y X X X X u βββββ=+++++ ()2i X 、3i X 是内生变量,4i X 、5i X 是外生变量第一阶段:分别用内生解释变量对所有外生解释变量回归;~~~~~2202425245i i i i X X X u πππ=+++ () ~~~~~3303435345i i i i X X X u πππ=+++ ()得2i X 、3i X 的拟合值~2i X 、~3i X ,也称为工具变量。
第二阶段:用上述拟合值代替实际值。
~~~~~~~~~~234512345 i i i i i i Y X X X X u βββββ=+++++ ()我们也称4i X ,5i X 为工具变量。
四、用工具变量法估计自回归模型由于考伊克模型与适应性期望模型均可化为一阶自回归模型。
而自回归模型中由于含有滞后应变量作为解释变量,所以回归系数的最小二乘估计是非一致的,为了得到一致的估计可用工具变量法,但用什么变量作为工具变量也是很难作出决断的。
例如对模型:1t t t t Y X Y u αβγ-=+++ ()利维亚坦(Liviatan )建议用解释变量的滞后一个时期1t X -的值作为随机解释变量1t Y -的工具变量。
但由于大多数经济时间序列在相邻两期之间存在高度相关,从而使Liviatan 的方法受到多重共线性的困扰。
在这里我们看一个例子:112231t t t t t Y X X Y v αβββ-=++++ ()假定1t Y -和t v 相关。
为了消除这种相关,假定我们采取如下工具变量法:先求t Y 对1t X 和2t X 的回归,并从此回归得到估计值ˆtY 。
然后做回归: 112231ˆt t t t t Y X X Y v αβββ-=++++ () 其中1ˆt Y -是从第一步回归估计处理的。
在这个例子中利用两阶段最小二乘法消除了原模型中1t Y -和t v 之间的相关性。
五、简述工具有效性的萨甘检验假定我们用一个工具变量来替代与误差项相关的自变量。
那么工具变量又会多有效呢也就是说我们如何知道所选的工具变量与误差项是独立的呢萨甘提出了一个统计量(即SARG )来检验工具变量法中所使用的工具有效性。