工具变量原理教学目的及要求:1、理解引入随机解释变量的目的及产生的影响2、理解估计量的渐进无偏性和一致性3、掌握随机解释变量OLS 的估计特性4、应用工具变量法解决随机解释变量问题第一节 随机解释变量问题一、随机解释变量问题产生的原因多元()线性回归模型:k(8-1)i ki k i i i U X X X Y ++⋅⋅⋅+++=ββββ22110其矩阵形式为:(8-2)U XB Y +=在多元()线性回归模型中,我们曾经假定,解释变量是非随机的。
如果是随机的,k j X j X 则与随机扰动项不相关。
即:i U(8-3)Cov ()i ij U X ,0=),,2,1;,,2,1(n i k j ⋅⋅⋅=⋅⋅⋅=许多经济现象中,这种假定是不符合实际的,因为许多经济变量是不能用控制的方法进行观测的,所以作为模型中的解释变量其取值就不可能在重复抽样中得到相同和确定的数值,其取值很难精确控制,也不易用实验方法进行精确观测,解释变量成为随机变量。
又由于随机项包含了模型U 中略去的解释变量,而略去的解释变量往往是同模型中相关的变量,因而就很有可能在是随机变X 量的情况下与随机项相关,这样原有的古典假设就不能满足,产生随机解释变量。
U 在联立方程模型以及模型中包含有滞后内生变量等情况下,如果扰动项是序列相关的,那么均有扰动项和解释变量之间的相关性的出现,模型就存在随机解释变量问题。
例如,固定资产投资与国民收入的关系满足如下模型:t t t t u I Y I +++=-1210βββ其中,为期的固定资产投资,为期的固定资产投资,为期的国民收入,因为t I t 1-t I 1-t t Y t 是随机变量,故模型中存在随机解释变量。
1-t I 再如,消费与收入之间的影响关系模型为t t t t u C Y C +++=-1210βββ其中,为期的消费支出,为期的消费支出,是期的收入,因为是随机变t C t 1-t C 1-t t Y t 1-t C 量,故模型中存在随机解释变量。
二、随机解释变量问题的后果模型中,在解释变量为随机变量并且与扰动项相关的情况下,应用普通最小二乘法估计参数可能会出现估计的不一致性,使得估计值产生很大的偏误,造成拟合优度检验的全面失准,检验失F 效,检验失去意义。
在这种情况下,各种统计检验得到的是虚假的结果,不能作为判别估计式优劣t 的依据。
随机解释变量带来何种结果取决于它与随机误差项是否相关: 1)随机解释变量与随机误差项不相关2)随机解释变量与随机误差项在小样本下相关,在大样本下渐进无关 3)随机解释变量与随机误差项高度相关 4)滞后被解释变量与随机误差项相关第二节 随机解释变量模型的估计特性我们讨论的估计量的性质(包括无偏性、最小方差性)都是在样本容量一定的情况下的统计性质,在数理统计上叫做小样本性质。
在某些情况下,小样本时的估计量不具有某种统计性质,但是随着样本容量的增大,一个估计量在小样本时不具有的性质,大样本时就逐渐具有这种统计性质了,这种性质我们叫做大样本性质或叫做估计量的渐近统计性质。
常用的渐近统计性质有渐近无偏性和一致性。
一、估计量的渐近无偏性记代表模型中参数的估计量,其上标表示样本容量。
一般来说,取如下的样本容量,)(ˆn ββn n,为一随机变量。
随着样本容量的增大,估计量构成一个估计量(随机k n n n <⋯<<21)(ˆn βn )(ˆn β变量)序列:=,,…,,…{})(ˆn β)(1ˆn β)(2ˆn β)(ˆkn β(8-4)所谓渐近理论就是讨论当变得很大时,以上这些序列会有怎样的结果。
n 序列如果满足: {})(ˆn β()= (8-5) E n ∞→lim )(ˆn ββ则称为的渐近无偏估计。
也就是说,当样本容量越来越大,趋于时,的均值越)(ˆn ββn ∞)(ˆn β来越接近参数的真值。
β这里需要注意的是,有些估计量在小样本下是有偏的,但在大样本下是无偏的,即是渐近无偏的。
例如随机变量的样本方差X212)(1∑=-=n i i x X X n S 容易证明(在数理统计中已有证明)11()(22nS E x -=σ其中,为总体方差。
很明显,在小样本下,作为的估计量是有偏的,但随着的无限2σ2x S 2σn 增大,趋于总体的真正方差,因此是渐近无偏的。
可见,通过增加样本容量,可以改善参)(2x S E 2σ数估计的精度。
二、估计量的一致性如果随着样本容量的增大,估计量几乎处处趋近于真值,我们说为的一致估计量,)(ˆn ββ)(ˆn ββ或称依概率收敛于。
如果样本容量无限增大时,的分布收敛于,的方差趋于零,)(ˆn ββ)(ˆn ββ)(ˆn β就是的一致估计量。
)(ˆn ββ一致估计量可以记为:或简记为。
式中表示概率极限。
{}1ˆlim )(==∞→ββn n P ββ=∞→)(ˆlim n n P ∞→n P lim 为简单起见,可略去上标,记作 n ββ=ˆlim P概率极限有下列运算法则:为常数)X lim()X lim(cP c P =c为常数22112211X lim X lim )X X lim(P c P c c c P ⋅+⋅=+21,c c )X lim()X lim()X X lim(2121P P P ⋅=⋅ 0)X lim(,)X lim()X lim()X X lim(22121≠=P P P P[]11)X lim()X lim(--=P P 这里需要弄清楚一点是,无偏性与一致性是两个截然不同的概念,无偏性可以对任何样本容量成立,而一致性则是对大样本而言的,是一种渐近性质。
在大样本的条件下,一致估计量具有很高的精度,但在小样本时一致性不起作用。
可以证明,为的一致估计量,当且仅当)(ˆn ββ (8-6)ββ=∞→)ˆ(lim )(n n E 0)ˆvar(lim )(=∞→n n β时成立。
此充分必要条件说明,是渐近无偏的,且当样本容量无限增大时的方差趋于零。
βˆβˆ上面的讨论是对随机变量而言的,对于随机向量同样有类似的结论。
三、随机解释变量模型OLS 估计特性计量经济模型中一旦出现了随机解释变量,如果仍用最小二乘法估计模型参数,不同性质的随机解释变量会出现不同的结果。
为了简单起见,我们用一元线性回归模型进行说明。
给定一元线性回归模型:(8-7)i i i U X Y ++=10ββ),...,2,1(n i =假设为一随机变量,模型满足其他古典假设条件。
X 对式(8-7),其离差形式为:(8-8)i i i u x y +=1β其中, ,,Y Y y i i -=X X x i i -=UU u i i -=应用普通最小二乘法,则有(8-9)21ˆii i x y x ∑∑=β把(8-8)中的代入(8-9),则可以得到i y (8-10)∑∑∑∑+=∑+∑==212121)(ˆiii ii i i iii xu x x u x x xyx βββ而11222222()()i i n n i i i i x u x u x u x u E E x x x x ∑=+++∑∑∑∑(8-11))()()()()()(2222121n in iiu E x x E u E x x E u E x x E ∑++∑+∑= 下面分三种情况讨论: 1.和是独立的X U⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧+=∑∑211)ˆ(i i i x u x E E ββ因和相互独立,并且 i x i u 0)(=i u E ∴0)(2=∑∑ii i x u x E 故有ββ=)ˆ(E 2.与小样本下相关,大样本下渐近无关 i x i u 小样本:0)(≠i i u x E 所以,最小二乘法估计是有偏的。
11)ˆ(ββ≠E 大样本: 0)1(lim =∑∞→i i n u x nP 对式(8-10)两边取概率极限可有(8-12)∑∑+=211lim )ˆlim(i i i x u x P P ββ121lim 1i i i x u n P x nβ=+∑∑因此,在假定的情况下,有 0)1(lim 2≠∑i x nP(8-13)ββ=)ˆlim(P 说明最小二乘估计式也具有一致性特性。
3.与高度相关i x i u 0)1(lim ≠∑∞→i i n u x nP 讨论一般情况下回归模型(8-8)式(8-14)i i i u x y +=1β),......2,1(n i =假设:,,和之间的相关系数是,如果采用普通最小二乘2)(x i x Var σ=2)(u i u Var σ=i x i u ρ法估计上式,可以得到:∑∑+=211lim )ˆlim(i i i x u x P P ββ∑∑+=211lim 1limi i i x nP u x n P β(8-15))(),(x Var u x Cov +=βu x σβρσ=+因为:代入上式即可。
cov(,)i ix ux u x u ρσσ===∑可见,如果很高,只有当是很小的情况下,(8-15)式的渐近误差才是可以忽略的。
否ρx uσσ则,最小二乘估计式将存在着很大的偏误。
第三节 随机解释变量模型的处理如果模型中存在随机解释变量问题,则一般的随机解释变量与随机误差项之间是相关的,最小二乘估计量有偏且不一致,需要利用其他估计方法对模型参数进行估计。
一、工具变量法工具变量(Instrument Variable, IV )法就是当随机解释变量与随机误差项相关时,寻找一个与随机解释变量高度相关,但与随机误差项不相关的变量,用该变量替代模型中的随机解释变量,进行模型的参数估计。
我们称这一替代随机解释变量的变量为工具变量。
(一)选择工具变量的要求作为工具变量,必须满足以下四个条件:第一,工具变量必须是有明确经济含义的外生变量;第二,工具变量与其替代的随机解释变量高度相关,而又与随机误差项不相关; 第三,工具变量与模型中的其他解释变量也不相关,以免出现多重共线性; 第四,模型中的多个工具变量之间不相关。
(二)工具变量的应用工具变量对随机解释变量的替代并不是“完全的”替代,即不是用工具变量代换模型中对应的随机解释变量,而是在最小二乘法的正规方程组中用工具变量对随机解释变量进行部分替代。
对于一元线性回归模型(8-7)和(8-8)i i i u x y +=1β若与不相关,满足所有的统计假定。
应用OLS 法,利用微分求极值的办法求出正规方程:x u u (8-16)2101i i ii ix y βx Y ββX ⎧=⎪⎨=+⎪⎩∑∑现采用另一种方法来导出OLS 正规方程。
我们以(同乘以两边,i x ),,2,1n i ⋅⋅⋅=1i i i y x u β=+得个式子,求和得:n+(8-17)21iii x yx β=∑∑i i x u ∑因为与不相关,从而可以略去,就可以得OLS 正规方程。