当前位置:
文档之家› 异方差性的概念、类型、后果、检验及其修正方法含案例
异方差性的概念、类型、后果、检验及其修正方法含案例
例4.1.1: 在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中,i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。
因此,i的方差往往随Xi的增加而增加,呈单调递增型变化 。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特检 验“White Heteroskedasticity(no cross terms)” 这样两个 选择。
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于:用什么来表示随机误差项的方差? 一般的处理方法:
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
【书上这句话有点问题】
其中 所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
(注意:其中的2完全可以是1)
• 那么,加权最小二乘法的“权”即为
注意:这里的“权”仍然是指用来乘原模型两边的“权”,相当于对 原模型的残差ei加权。将这里的权数平方之后,才是对原模型的 路漫残漫其修差远兮平, 方ei2加权的权数。
吾将上下而求索
补充
• 特别地,如果像教材P111(4.1.4)式那样,近似地有
i=1,2,…,n
这就是加权最小二乘法。 在这里,权数为
。
注意:将这里的权数平方之后,才是对残差平方加权的权数。
路漫漫其修远兮, 吾将上下而求索
• 【第三版P114补充】可见,实施加权最小二乘法的关 键是寻找适当的“权”,或者说寻找模型中随机干扰项 的方差与解释变量间的适当的函数形式。
• 如果发现
• 那么,可以用
作为权数,去乘原模型的
两边,得到下面的模型:
• 该模型满足同方差性,可以用普通最小二乘法估计:
路漫漫其修远兮, 吾将上下而求索
i=1,2,…,n
• Eviews软件中的加权最小二乘法(WLS)正是这样 设计的: (★)
所以,Eviews软件中WLS法的“权”,是指对原模型两边加权的 路漫漫其“修权远兮”,,而不是对原模型的残差平方ei2加权的权数。
• 于是,我们可以
对较小的残差平方ei2赋予较大的权数, 对较大的残差平方ei2赋予较小的权数。
• 加权最小二乘法就是对加了权重的残差平方和 实施OLS法:
→ 最小
路漫漫其修远兮, 吾将上下而求索
2.一个例子(重要! )
• 例如:如果在检验过程中已经知道:
路漫漫其修远兮, 吾将上下而求索
在该模型中,存在 即满足同方差性。
– 例如:在递增的异方差下,与较小的Xi对应的Yi离回归线 较近,残差ei较小;而与较大的Xi对应的Yi离回归线较远, 残差ei较大。为了更可靠地估计总体回归函数,我们应该给 那些紧密围绕其(总体)均值的观测值较大的权数,而给 那些远离其均值的观测值较小的权数。——古扎拉蒂P355
路漫漫其修远兮, 吾将上下而求索
– 以教材P118的例子为例,包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”的输出结果为 :
路漫漫其修远兮, 吾将上下而求索
怀特 检验 的软 件输 出界 面:
路漫漫其修远兮, 吾将上下而求索
可见,怀特统计量nR2=20.55085【=31 ×0.662931】,大于自由度【也即辅 助回归方程中解释变量的个数】为5的 2分布临界值11.07,因此,在5%的显 著性水平下拒绝同方差的原假设。
(1)用X-Y的散点图进行判断(李子奈P108)
看是否存在明显的散点扩大、缩小或复杂型 趋势(即不在一个固定的带型域中)。
随机误差项的 方差描述的是 取值的离散程 度。而由于被 解释变量Y与随 机误差项有相 同的方差,所 以利用Y与X之 间的相关图形 也可以粗略地 看出的离散程 度与X之间是否 有相关关系。
路漫漫其修远兮, 吾将上下而求索
H0成立,意味着同方差; H1成立,意味着异方差。
⑥检验。给定显著性水平,确定F分布表中相应的临界值 F(1,2)。
若F≥F(1,2),则拒绝H0,认为存在异方差; 反之,则不存在异方差。
路漫漫其修远兮, 吾将上下而求索
5.怀特(White)检验
• G-Q检验需按某一被认为有可能引起异方差的解释变 量对样本排序,而且只能检验单调递增或单调递减型 异方差;怀特(White)检验则不需要排序,且对任何 形式的异方差都适用。
路漫漫其修远兮, 吾将上下而求索
例4.1.2:以绝对收入假设为理论假设、以分组数据( 将居民按照收入等距离分成n组,取组平均数为样本观 测值)作样本建立居民消费函数:
Ci= 0+1Yi+i
一般情况下:居民收入服从正态分布,处于中等收入组中 的人数最多,处于两端收入组中的人数最少。而人数多的组 平均数的误差小,人数少的组平均数的误差大。所以样本观 测值的观测误差随着解释变量观测值的增大而先减后增。
异方差性的概念、类型 、后果、检验及其修正
方法含案例
路漫漫其修远兮, 吾将上下而求索
2020年4月13日星期一
一、异方差性的概念及类型
1.什么是异方差?
对于模型
(i=1,2,…,n)
同方差性假设为
(i=1,2,…,n)
如果出现
(i=1,2,…,n)
即对于不同的样本点i ,随机误差项的方差不再是常数,则认 为出现了异方差性。
如果样本观测值的观测误差构成随机误差项的主要部分,那 么对于不同的样本点,随机误差项的方差随着解释变量观测值 的增大而先减后增(U形),出现了异方差性。
路漫漫其修远兮, 吾将上下而求索
例4.1.3:以某一行业的企业为样本建立企业生产函数模型
Yi=Ai1 Ki2 Li3ei
产出量为被解释变量,选择资本、劳动、技术等投入要素 为解释变量,那么每个企业所处的外部环境对产出量的影 响被包含在随机误差项中。
路漫漫其修远兮, 吾将上下而求索
4.戈德菲尔德-匡特(Goldfeld-Quandt)检验
G-Q检验以F检验为基础,仅适用于样本容量较大、 异方差为单调递增或单调递减的情况。
G-Q检验的思想: 先按某一被认为有可能引起异方差的解释变量对样 本排序,再将排序后的样本一分为二,对子样本①和 子样本②分别进行OLS回归,然后利用两个子样本的 残差平方和之比构造F统计量进行异方差检验。
路漫漫其修远兮, 吾将上下而求索
则在同方差性假设下【也即H0:1=…= 5=0 】,该辅助回归 方程的可决系数R2与样本容量n的乘积渐近地服从自由度=辅 助回归方程中解释变量个数【该例= 5】的2分布:
路漫漫其修远兮, 吾将上下而求索
怀特(White)检验的EViews软件操作要点
• 在OLS的方程对象Equation中,选择View/Residual tests/White Heteroskedasticity。
由于每个企业所处的外部环境对产出量的影响程度不同, 造成了随机误差项的异方差性。
这时,随机误差项的方差并不随某一个解释变量观测值 的变化而呈规律性变化,为复杂型的一种。
路漫漫其修远兮, 吾将上下而求索
规律
• 一般经验告诉人们:对于采用截面数据作样本 的计量经济学问题,由于在不同样本点(即不 同空间)上解释变量以外的其他因素的差异较 大,所以往往存在异方差性。
路漫漫其修远兮, 吾将上下而求索
• 异方差一般可以归结为三种类型:
(1)单调递增型: i2=f(Xi)随Xi的增大而增大; (2)单调递减型: i2=f(Xi )随Xi的增大而减小; (3)复杂型: i2=f(Xi )随Xi的变化呈复杂形式。
路漫漫其修远兮, 吾将上下而求索
3.实际经济问题中的异方差性
注意:对于每一个样本点i,随机误差项i都是随机变量,服
从均值为0的正态分布;而方差i2衡量的是随机误差项围绕其 均值0的分散程度。所以,所谓异方差性,是指这些服从正态
分布的随机变量围绕其均值0的分散程度不同。
路漫漫其修远兮, 吾将上下而求索
概率密度
或者,也可以说,对于每一个样本点i,随机误差项的方差i2衡 量的是被解释变量的观测值Yi围绕回归线E(Yi)=0+1Xi1+…+kXik 的分散程度。而所谓异方差性,是指被解释变量观测值的分散 程度随样本点的不同而不同。 【庞皓P130】
• 同方差性假定是指,每个i围绕其0均值的方差
并不随解释变量Xi的变化而变化,不论解释变量 的观测值是大还是小,每个i的方差保持相同,
即 i2 =常数 (i=1,2,…,n)
• 在异方差的情况下,i2已不是常数,它随Xi的
变化而变化,即 i2 =f(Xi) (i=1,2,…,n)
路漫漫其修远兮, 吾将上下而求索
二、异方差性的后果
1.参数估计量非有效
• 当计量经济学模型出现异方差性时,其普通最小二乘法参 数估计量仍然具有无偏性,但不具有有效性。而且,在大样 本情况下,参数估计量仍然不具有渐近有效性。