第7章 随机解释变量单方程线性计量经济学模型假定解释变量是确定性变量,并且与随机误差项不相关,违背这一基本假设的问题被称为随机解释变量问题。
本章介绍了随机解释变量问题的概念、产生的原因和后果、检验方法以及解决方法。
随机解释变量问题的概念对于计量经济模型n21i i k i k i 22i 110 ,,,ββββ=+++++=u X X X Y i(7.1.1)其中一个基本假设是解释变量k 21,,X X X 是确定性变量,即解释变量与随机扰动项不相关。
但是在现实经济生活中,这个假定不一定成立,这一方面是因为用于建模的经济变量的观测值一般会存在观测误差,另一方面是经济变量之间联系的普遍性使得解释变量可能在一定程度上依赖于应变量,即解释变量X 影响应变量Y ,而应变量Y 也会反过来影响解释变量X 。
模型中如果存在一个或多个随机变量作为解释变量,就称为模型出现了随机解释变量问题。
其中k x 可能与随机误差项u 不相关,就是说,解释变量121,,-k x x x 都是外生的,但k x 有可能在方程(4.4.1)中是内生的,则称原模型存在随机解释变量问题。
内生性可能源自于省略误差、测量误差,联立性等①。
为讨论方便,我们假设中2X 为随机解释变量。
在模型()中,根据解释变量2X 与随机误差项的关系,可以分为三种类型: 1)随机解释变量与随机干扰项独立)()(),(),(222===u E x E u x E u X Cov(7.1.2)2)随机解释变量与随机干扰项同期无关但异期相关n 21i 0),(),(i 2i 2 ,,,===u x E u X Cov i i①具体详见《Econometric analysis of cross section and panal data 》(Jeffrey Wooldrige,2007 )。
(7.1.3)n21i 0),(),(s -i 2s -i 2 ,,,=≠=u x E u X Cov i i(7.1.4)3)随机解释变量与随机干扰项同期相关n 21i 0),(),(i 2i 2 ,,,=≠=u x E u X Cov i i(7.1.5)实际经济问题中的随机解释变量在许多经济现象中,自变量的非随机性假定有时是不符合实际的。
因为,⑴ 许多经济变量是不能用控制的方法进行观测的,所以作为模型中的解释变量其取值就不可能是确定的,而是随机的。
⑵ 由于随机误差项中包含了模型中略去的解释变量,而略去的解释变量同模型中保留的解释变量往往存在一定的相关关系。
⑶ 在自回归模型中,因变量作为解释变量也必定是随机变量。
因此,我们必须对模型中的解释变量为随机变量且与随机项相关的情形进行讨论。
在单方程计量经济学模型中,凡是外生变量都被认为是确定性的,于是随机解释变量问题主要变现于用滞后被解释变量作为模型的解释变量的情况。
同时,由于经济活动具有连续性,使得这类模型在以时间序列数据作样本的模型中占据较大份额。
例如,消费不仅受收入的影响,还受前期消费水平的影响。
投资不仅受收入的影响,还受前期投资水平的影响。
但是,并不是所有包含滞后被解释变量的模型都会带来随机解释变量问题,下面通过几个例子来说明。
耐用品的存量由前一个时期的存量和当期收入共同决定,于是著名的“耐用品存量调整模型”表示为t t t t u Q I Q +++=-1210βββ n t ,,3,2,1 = (7.2.1)这是一个滞后被解释变量作为解释变量的自回归模型。
但是如果模型中不存在随机误差项的序列相关性,那么随机解释变量t t t u u Q 相关,而与只与11--不相关,属于上述的第一种情况。
再如,在著名的“合理预期的消费函数模型”中,首先认为消费是由对收入的预期所决定的,或者说消费是有计划的,而这个计划是根据对收入的预期制定的。
于是有:1110110---++=++=t e t t t e t t u IC u I C ββββ (7.2.2)其中,et I 表示t 期收入预期值,而预期收入与实际收入之间存在差距,用函数形式表现出来为:()e t t e t I I I 11-+-=λλ (7.2.3)该式是由合理预期理论给出来的,因此可以进一步推导出()t e t t t u I I C ++-+=-11101λβλββ()()t t t t u u C I +--+-+=--101101βλλββ()()111011---++-+-=t t t t u u C I λλλβλβ (7.2.4) 在该模型中,作为解释变量的1-t C 是一个随机解释变量,同时由于11--t t u C 与高度相关,所以它与模型(7.2.4)中的随机误差项1--t t u u λ也高度相关。
属于上述第三种类型。
随机解释变量的后果当模型存在随机解释变量时,如果仍采用普通最小二乘法估计模型参数,不同性质的随机解释变量会产生不同的后果。
对一元线性回归模型i i 10μββ++=X Y i在前面得到如下最小二乘估计量:(7.3.1)随机解释变量X 与随机干扰项μ的关系不同,参数OLS 估计量的统计性质也会不同。
7.3.1估计量的渐近特征如果一个变量是随机变量,它的精确抽样分布是很难找到的,只能是渐进结果。
例如,∑∑∑∑+==2iii12iii1y xx x x μββ当线性回归模型满足最小二乘法的假定条件时,其参数的最小二乘估计量具有无偏性和有效性。
优势最小二乘估计量并不具有这种统计特征,但随着样本容量的增加却具有了这种特征。
1)渐近无偏性设∧nβ是参数β的估计量,其中n 为样本容量,设依次抽样的样本容量n 分别为r n n n <<< 21,则∧nβ是一个随机变量,其数学期望值为E(∧n β),方差为Var(∧nβ)=E[∧nβ-E(∧nβ)]2。
随着样本容量n 取值的不同,得到下面随机解释变量序列|∧nβ|∧∧∧=rn n n βββ,,,21| E(∧nβ)|∧∧∧=)(,,)(),(21rn n n E E E βββ| Var(∧nβ)|222)]([,,)]([,)]([2211∧∧∧∧∧∧---=rr n n n n n n E E E E E E ββββββ (7.3.2)所谓渐近分布是指。
当样本容量n 趋于无穷大时,上面各随机变量序列分别收敛到一定分布。
对于均值、方差存在以下关系。
)E() E( n∧∧∞→=ββn Lim2n)]E([E ) Var( ∧∧∧∞→-=βββn Lim (7.3.3)其中)E(∧β,2)]E([E ∧∧-ββ分别是∧nβ的渐近期望值和渐进方差。
如果ββ=∧∞→) E( nn Lim则称∧nβ是β的渐近无偏估计。
即当样本容量n 充分大时,∧nβ的均值趋向于总体参数β。
以上的讨论是在样本容量充分大的情况下进行的。
如果小样本估计量是有偏的,但其估计量具有渐近无偏性,我们就可以增加样本来优化估计结果。
2)一致性一致性估计是指对于任意给定的两个任意小的正数ηε,,总存在一个充分大的样本容量0n ,使得当n>0n 时,满足ηεββ->⎭⎬⎫⎩⎨⎧<-∧1||n P (7.3.4)称估计序列ββ是∧n 的一致估计序列,即当样本容量n 充分大时,∧nβ值趋向于总体真实值的概率接近于1,记为ββ=∧∞→nn L P im (7.3.5)也可以简记为 ββ=∧lim P综上所述,由数理统计的理论可知,要想建立一个一致性估计量,必须满足两个条件ββ=∧∞→)(im n n E L 和0)(im =∧∞→nn Var L β即估计量∧nβ具有渐近无偏性,并且当样本容量充分大时,∧nβ的方差趋近于0。
3)随机解释变量模型最小二乘估计量的统计特征 随机解释变量X 的OLS 估计量可能出现下面三种情况(1)如果X 与随机误差项u 相互独立,即0)()()(==i i i i u E X E u X E ,得到的参数估计量仍然是无偏一致估计量。
由于()∑∑∑∑-=-=ii i i iii u X u X u X Xu x因此则有 []1211)()(1)(βββ=-+=∑∑∑∧iii i u E X u X E x E (7.3.6)这说明∧1β是1β的无偏估计量。
同理可以证明∧0β是0β的无偏估计量。
(2)如果X 与μ同期不相关,而异期相关,得到的参数估计量有偏,但却是一致的。
由(7.3.1)易知(7.3.7) 尽管i X 与i u 同期无关,但对任一的分母中一定包含不同期的X ;由异期相关性知i k 与i u 相关,导致,ββ1i )ˆ(≠E 即参数估计量是有偏的。
但是∑∑∑+=+=)()()ˆ(i1i 211μβμββi ii k E x xE E 1i 12i 12i i )(ar ),(ov )1lim()1(lim )(lim βμβμβμβ=+=+=+∑∑∑∑∞→i i i i i i n X V X C x nP x n P x x P(7.3.8)即在假定01im2≠∑i x nL P 的情况下,分子项等于0,于是上式成立。
这说明最小二乘估计量∧1β虽然是有偏的,但它是1β的一致估计量。
(3)如果随机解释变量X 与随机误差项u 同期相关,得到的参数估计量有偏且非一致。
由于 Cov ()0,≠i i u X 所以则有0),(1im≠=∑i i i i u X Cov u X nL P (7.3.9) 即12111lim 1lim 1limlim βββ≠-+=∑∑∑∧i ii i x nP u n P X u X n P P (7.3.10)这说明最小二乘估计量∧1β是有偏的,也不是1β的一致估计量。
同理也可以证明∧0β是有偏的,也不是0β的一致估计量。
但是需要注意的是,如果模型中带有滞后被解释变量作为解释变量,则当该滞后被解释变量与随机干扰项同期相关时,普通最小二乘估计量是有偏的且非一致的。
即使同期无关,其普通最小二乘估计量也是有偏的,因为此时肯定会出现异期相关。
总之,在存在随机解释变量问题时,采用OLS 法估计模型参数,得到的参数估计量在小样本情况下是有偏的,在大样本情况下也不具有渐进无偏性,就有可能产生严重的误导结果。
随机解释变量的检验(内生性)随机解释变量的内生性检验在国内,暂时还很少提及,这里简单介绍下国外学者的主要检验方法之一—豪斯曼检验(Hausman,1978)。
举例说明,假定我们有单一的被怀疑的内生变量u z z x y ++++=231210ββββ (7.4.1)其中,假定x 是内生性变量,21,z z 是外生的。
如果x 与u 不相关,我们应该用OLS 法估计(4.4.20)模型。