当前位置:文档之家› 计量经济学:异方差性

计量经济学:异方差性

异方差性在现实经济活动中,最小二乘法的基本假定并非都能满足,上一章介绍的多重共线性只是其中一个方面,本章将讨论违背基本假定的另一个方面——异方差性。

虽然它们都是违背了基本假定,但前者属于解释变量之间存在的问题,后者是随机误差项出现的问题。

本章将讨论异方差性的实质、异方差出现的原因、异方差的后果,并介绍检验和修正异方差的若干方法。

第一节异方差性的概念一、异方差性的实质第二章提出的基本假定中,要求对所有的i (i=1,2,…,n )都有2)(σ=i u Var (5.1) 也就是说i u 具有同方差性。

这里的方差2σ度量的是随机误差项围绕其均值的分散程度。

由于0)(=i u E ,所以等价地说,方差2σ度量的是被解释变量Y 的观测值围绕回归线)(i Y E =ki k i X X βββ+++ 221的分散程度,同方差性实际指的是相对于回归线被解释变量所有观测值的分散程度相同。

设模型为n i u X X Y iki k i i ,,2,1221 =++++=βββ (5.2)如果其它假定均不变,但模型中随机误差项i u 的方差为 ).,,3,2,1(,)(22n i u Var i i ==σ (5.3)则称i u 具有异方差性。

由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,如图5.1所示,所以进一步可以把异方差看成是由于某个解释变量的变化而引起的,则)()(222i i i X f u Var σσ== (5.4)图5.1二、产生异方差的原因由于现实经济活动的错综复杂性,一些经济现象的变动与同方差性的假定经常是相悖的。

所以在计量经济分析中,往往会出现某些因素随其观测值的变化而对被解释变量产生不同的影响,导致随机误差项的方差相异。

通常产生异方差有以下主要原因:1、模型中省略了某些重要的解释变量异方差性表现在随机误差上,但它的产生却与解释变量的变化有紧密的关系。

如果计量模型本来应当为i i i i u X X Y +++=33221βββ,假如被略去了i X 3,而采用了*221i i i u X Y ++=ββ (5.5)当被略去的i X 3与i X 2有呈同方向或反方向变化的趋势时,i X 3随i X 2的有规律变化会体现在(5.5)式的*i u 中。

如果将某些未在模型中出现的重要影响因素归入随机误差项,而且这些影响因素的变化具有差异性,则会对被解释变量产生不同的影响,从而导致误差项的方差随之变化,即产生异方差性。

在第四章已经讨论过,可以通过剔除变量的方法去避免多重共线性的影响,但是如果删除了重要的变量又有可能引起异方差性。

这是在建模过程中应当引起注意的问题。

2、模型设定误差模型的设定主要包括变量的选择和模型数学形式的确定。

模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。

除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。

3、测量误差的变化样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。

例如生产函数模型,由于生产要素投入的增加与生产规模相联系,在其他条件不变的情况下,测量误差可能会随生产规模的扩大而增加,随机误差项的方差会随资本和劳动力投入的增加而变化。

另一方面当用时间序列数据估计生产函数时,由于抽样技术和数据收集处理方法的改进,观测误差有可能会随着时间的推移而降低。

4、截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。

例如,运用截面数据研究消费和收入之间的关系时,如果采取不同家庭收入组的数据,低收入组的家庭用于购买生活必需品的比例相对较大,消费的分散程度不大,组内各家庭消费的差异也较小。

高收入组的家庭有更多自由支配的收入,家庭消费有更广泛的选择范围,消费的分散程度较大,组内各家庭消费的差异也较大。

这种不同收入组家庭的消费偏离均值程度的差异,最终反映为随机误差项偏离其均值的程度有变化,而出现异方差。

异方差性在截面数据中比在时间序列数据中可能更常出现,这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。

不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。

以上只是对产生异方差的经验总结,在建立计量经济学模型的过程中,具体是什么原因产生异方差,应对变量的经济意义和数据所表现出的特征进行认真地分析。

第二节 异方差性的后果在计量经济分析中,如果模型里存在异方差,则对模型会产生以下后果。

一、对参数估计式统计特性的影响1、参数的OLS 估计仍然具有无偏性由第二章参数估计的统计特性可知,参数OLS 估计的无偏性仅依赖于基本假定中随机误差项的零均值假定(即0)(=i u E ),以及解释变量的非随机性,异方差的存在并不影响参数估计式的无偏性。

2、参数OLS 估计式的方差不再是最小的在模型参数的所有线性估计式中,OLS 估计方差最小的重要前提条件之一是随机误差项为同方差,如果随机误差项是异方差的,将不能再保证最小二乘估计的方差最小。

事实上可以证明,能够找到比OLS 估计的方差更小的估计方法,本章第四节将会介绍这类估计方法。

也就是说,在异方差存在时,虽然OLS 估计仍保持线性无偏性和一致性,但已失去了有效性,即参数的OLS 估计量不再具有最小方差。

(证明见本章附录5.1)。

二、对参数显著性检验的影响在i u 存在异方差时,OLS 估计式不再具有最小方差,如果仍然用不存在异方差性时的OLS 方式估计其方差,例如在一元回归时仍用∑=222)ˆ(i x Var σβ去估计参数估计式的方差,将会低估存在异方差时的真实方差,从而低估)ˆ(2βSE ,这将导致夸大用于参数显著性检验的t 统计量。

如果仍用夸大的t 统计量进行参数的显著性检验,可能造成本应接受的原假设被错误的拒绝,从而夸大所估计参数的统计显著性。

三、对预测的影响尽管参数的OLS 估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对Y 的预测也将不是有效的。

在i u 存在异方差时,2i σ与i X 的变化有关,参数OLS 估计的方差)ˆ(kVar β不能唯一确定,Y 预测区间的建立将发生困难。

而且)ˆ(kVar β会增大,Y 预测值的精确度也将会下降。

异方差性的存在,会对回归模型的正确建立和统计推断带来严重后果,因此在计量经济分析中,有必要检验模型是否存在异方差。

第三节 异方差性的检验要检验模型中是否有异方差,需要了解随机误差项i u 的概率分布。

由于随机误差很难直接观测,只能对随机误差的分布特征进行某种推测,因此对异方差性的检验还没有完全可靠的准则,只能针对产生异方差不同原因的假设,提出一些检验异方差的经验办法。

本节只介绍一些最常用的方法。

一、图示检验法1、相关图形分析方差描述的是随机变量相对其均值的离散程度,而被解释变量Y 与随机误差项u 有相同的方差,所以分析Y 与X 的相关图形,可以初略地看到Y 的离散程度及与X 之间是否有相关关系。

如果随着X 的增加,Y 的离散程度有逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。

通常在建立回归模型时,为了判断模型的函数形式,需要观测Y 与X 的相关图形,同时也可利用相关图形大致判断模型是否存在异方差性。

例如,用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据(表5.2),绘制出消费支出对纯收入的散点图(图5.2),其中用y1表示农村家庭消费支出,x1表示家庭纯收入。

图5.22、残差图形分析 虽然随机误差项无法观测,但样本回归的残差一定程度上反映了随机误差的某些分布特征,可通过残差的图形对异方差性作观察。

例如,一元线性回归模型i i i u X Y ++=21ββ,在OLS 估计基础上得到残差的平方2i e ,然后绘制出2i e 对i X 的散点图,如果2i e 不随i X 而变化,如图5.3a 所示,则表明i u 不存在异方差;如果2i e 随i X 而变化,如图5.3b 、c 、d 所示,则表明i u 存在异方差。

2i e2i e ia 2i e ibc d0 2i e i i图5.3图形法的特点是简单易操作,不足是对异方差性的判断比较粗糙,由于引起异方差性的原因错综复杂,仅靠图形法有时很难准确对是否存在异方差下结论,还需要采用其他统计检验方法。

二、戈德菲尔德-夸特(Goldfeld-Quanadt )检验该检验方法是戈德菲尔德和夸特于1965年提出的,可用于检验递增性或递减性异方差。

此检验的基本思想是将样本分为两部分,然后分别对两个样本进行回归,并计算比较两个回归的剩余平方和是否有明显差异,以此判断是否存在异方差。

1、检验的前提条件(1)此检验只适用于大样本。

(2)除了同方差假定不成立外,其它假定均满足。

2、检验的具体做法(1)将观测值按解释变量i X 的大小顺序排序。

(2)将排列在中间的C 个(约1/4)的观察值删除掉,再将剩余的观测值分为两个部分,每部分观察值的个数为(n-c)/2。

(3)提出假设。

即:0H 两部分数据的方差相等;:1H 两部分数据的方差不相等。

(4)构造F 统计量。

分别对上述两个部分的观察值作回归,由此得到的两个部分的残差平方和,以∑21i e 表示前一部分样本回归产生的残差平方和,以∑22i e表示后一部分样本回归产生的残差平方和,它们的自由度均为[(n-c)/2]-k ,k 为参数的个数。

在原假设成立的条件下,因∑∑2221i i e e 和分别服从自由度均为[(n-c)/2]-k 的2χ分布⒈,可导出 )2,2(~]2/[]2/[21222122*k c n k c n F e e k c n e k c n e F i ii i ----=----=∑∑∑∑ (5.7) (5)判断。

给定显著性水平α,查F 分布表,得临界值)2,2()()(k c n k c n F F ----=αα。

计算统计量*F ,如果*F >)(αF ,则拒绝原假设,不拒绝备择假设,即认为模型中的随机误差存在异方差。

反之,如果*F <)(αF ,则不拒绝原假设,认为模型中随机误差项不存在异方差。

戈德菲尔德-夸特检验的功效,一是与对观测值的正确排序有关;二是与删除数据的个数c 的大小有关。

经验认为,当n=30时,可以取c=4;当n=60时,可以取c=10为宜。

该方法得到的只是异方差是否存在的判断,在多个解释变量的情况下,对判断是哪一个变量引起异方差还存在局限。

三、White 检验White 检验的基本思想是,如果存在异方差,其方差2t σ与解释变量有关系,分析2t σ是否与解释变量的某些形式有联系可判断异方差性。

相关主题