当前位置:文档之家› 5 第五章异方差性(第二版)

5 第五章异方差性(第二版)


ˆ*) Var ( 2
( x )
2 2 x i i 2 2 i
(证明见下页)
i2 未知,也不能再用 ( ei2 ) (n 2) ˆ 2 去估计, 2 ˆ * ) 无法确定。 ( i 不再是常数), Var (
2
2、如果仍然用不存在异方差性时的OLS方式估计其 方差,即用
第五章 异 方 差 性
引子:更为接近真实的结论是什么?
根据四川省2000年21个地市州医疗机构数与人口数资 料,分析医疗机构与人口数量的关系,建立卫生医疗机 构数与人口数的回归735 X Y i i
(291.5778) (0.644284) t =(-1.931062) (8.340265)

第五章
异方差性
本章将讨论四个问题: ●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
第一节 异方差性的概念
一、异方差的实质
同方差的含义 同方差性:对所有的 i (i 1,2,..., n) 有:
Var(ui ) = σ
2
因为方差是度量被解释变量
Y
的观测值围绕回归线
● 要求为大样本 ● 不仅能够检验异方差的存在性,同时在多变量 的情况下,还能判断出是哪一个变量引起的异方 差。
White 检验在EViews上的实现(用现成命令)
设 Yt 1 2 X 2t 3 X 3t t
1)Ls Y C X2 X3 2)点击 View/residual test/White/回车; 3)在出现的对话框中,选择 no cross terms(没有交叉项) /回车或 cross terms(有交叉项)/回车 4)出现输出框(比模型输出框多2行) Test直接给出了相关的统计量(F-statistic和Obs*R-squared)
ˆ ) 2 Var ( 2
2 x i
所估计的方差,会低估存在异方差时的的真实方差。
ˆ ) ,也就会高估 t 统计量,从而 后果: 低估 Var ( 2 夸大所估计参数的统计显著性。
三、预测精度降低,区间预测面临困难
尽管参数的OLS估计量仍然无偏,并且基 于此的预测也是无偏的,但是
ˆ 的方差增大,Y预测值 ●由于异方差的存在, k 的精确度将会下降
1)
键入 Sort /回车,在对话框中 键入X(或Xi中任一个)/ok;
2) 键入Sample /回车,在对话框中键入1 n1 /ok(前部分样本区) 3) 键入 Ls y c x(或Ls y c x2 x3 x4┄)/回车,得残差平方和S2小 4) 键入Sample /回车,在对话框中键入n1+c+1 n / ok(后部分样本区) 5) 键入Ls y c x(或Ls y c x2 x3 x4┄)/回车,记住残差平方和S2大 6)计算F统计量,作出是否拒绝原假设的结论。
并计算辅助回归的 R 2
3.计算统计量 nR2 2 R n 为样本容量, 为辅助回归可决系数 4.提出假设
H0 : 2 =...= 6 = 0, H1 : ( )不全为零 j j=2,,3,...,6
在大样本情况下可以证明,在零假设成立下,nR 2服
2 从自由度为5的 分布,即 nR 2 ~ 2 (5)
2 ◆如果 ei 不随 X i 而变化,则表明不存在异方差; 2 e ◆如果 i 随 X i 而变化,则表明存在异方差。
通过Eviews作x- e2 散点图 1、键入 LS y c x 作回归 2、键入 genr e1=resid 调用残差 3、键入 genr e2=e1^2 生成残差平方 4、键入 Scat X e2
或 1、点击 2、点击 3、选
Quick / Graph,键入 x e2 Line Graph,在出现的下拉菜单中 Scatter Diagram (散点图) / ok
e
2
e

2



e
2

(a)
X(d )
e
2
(b)

e
2 i
e
与 X i的散点图或Y与X的散点图,作出近似判
2 i
1.残差图形分析
设一元线性回归模型为:
Yi β1 β 2 X i u i
运用OLS法估计,得样本回归模型为:
ˆ + β ˆ X Yˆi = β 1 2
由上两式得残差: 绘制出 ei2 对 X i 的散点图
i
ˆ ei Yi - Y i
其中 t 为随机误差项。
2 2 2 但一般 t 未知,可用原模型回归剩余 et 作为 t 的 估计值,进行以上辅助回归。在大样本情况下寻求 能确定分布的统计量,判断 t2 的变化是否与解释
v
变量有关 (当有K个解释变量时,可作类似的含两两交互的辅 助回归)
检验的基本步骤: (手算)
1.求回归估计式并计算
例如两个解释变量的模型中 Yt = β1 + β2 X2t + β3 X3t +ut 2 设 t 与 X 2 和X 3 的关系为如下辅助回归:
t2 1 2 X 2t 3 X 3t 4 X 22t 5 X 32t 6 X 2t X 3t vt
(2)如果方差随X递减
统计量
F
2 e 1i ( 2 e 2i
nc k) 2 nc k) ( 2
F服从第一、二自由度均为 [( n c) 2] k 的F 分布。 判断:查表得F临界值
F [(n c)
2
k , (n c)
2
k]
◆若 F F(临界值),说明前部分与后部分比值显著大于1, 就拒绝 H 0 (同方差) ,即接受存在异方差性 ◆若 F F(临界值),说明前部分与后部分比值不显著大于1, 就接受 H 0 ,认为是同方差性
对比同方差时为
2 i
(i 1,2, n)
Var (ui | X 2i , , X ki )
2
异方差可看成是由于某个解释变量的变化而引起的,则
V a r (u i | X
2i , , X
ki )
2 i

2
f (X
mi
)
异方差性的图示
概 率 分 布 密 度
储蓄Y
收入X
二、产生异方差性的原因
X




(c )
X
(d )
X
2.相关图分析
Y与X之间图形举例:
分析Y与X的相关图形,也可以初略地看到Y的离散程度与X之间 是否有相关关系。 用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入 的数据,绘制出消费支出对纯收入的散点图,其中用 Y1 表示 农村家庭消费支出, X 1表示家庭纯收入。
2 e 的平方 t 。 2 et
ˆt ,并求残差 用OLS法估计原模型,计算残差 et Yt -Y
2.求辅助函数
2 2 e σ 用残差平方 t 作为异方差 t 的估计,并建立
2 2 X 2t , X 3t , X 2 , X t 3t , X 2t X 3t 的辅助回归,即
2 2 ˆ2 X 2t + α ˆ3 X 3t + α ˆ4 X 2 ˆ ˆ ˆ1 + α ˆt2 = α e + α X t 5 3t + α6 X 2t X 3t
5.检验
2 2 χ χ 给定显著性水平 ,查 分布表得临界值 (5) ,
2 2 nR χ 如果 (5) , H 0 不合理,则拒绝原假设 H 0,
即认为模型中随机误差存在异方差 。
2 2 nR 5 ( ) 则不拒绝 若
H 0 ,即认为模型中随
机误差是同方差。
White检验的特点
Xi
具体步骤:
●排序:将观测值按解释变量X大小顺序排列 ●数据分组:去掉中间的C个(约1/4)观测值,分别进 行前后两部分 (n c) 2 个观测值的回归 ●提出假设 :分别进行前后两部分回归的基础上,提出检 验假设:
H 0 : ui 是同方差(前后两部分方差无显著差异),
2 2 H : 即 0 i
三、White检验
基本思想:
2 如果存在异方差,其方差 t 与某解释变量有关系。
在不知道关于异方差的任何先验信息时,在大样本的 情况下,将OLS估计后的残差平方对解释变量的各种 形式(如常数、解释变量、解释变量的平方及其交叉 乘积等)构成一个辅助回归,利用辅助回归建立相应 的检验统计量来判断异方差性。
F服从第一、二自由度均为 [(n c) 2] k 的F 分布。 ●判断:
k] 2 2 ◆若 F F(临界值),说明后部分与前部分比值显著 大于1,就拒绝 H 0 (同方差) ,即接受存在异方差性 F [(n c) k , (n c)
查表得F临界值
◆若 F F (临界值),说明后部分与前部分比值不 显著大于1,就接受 H 0 ,认为是同方差性
● 由于 难以确定,Y的方差也难以确定,Y置 信区间的确定会出现困难
2 i
第三节 异方差性的检验
一、图形分析法
基本思想: 异方差性的表现是 u i 的方差随某个解释变量的变 化而变化,或Y的分散程度随X的变化而变化。因此可利 用 u i 的代表 ei 与某解释变量的散布图,观察是否存在异 方差及其异方差的形式,或从Y的分散程度与X的关系观 测是否存在异方差。 具体方法: 假定不存在异方差,进行回归,并计算剩余平方 描绘 断。
第二节 异方差性的后果
存在异方差时,OLS估计仍然是无偏估计,但是
一、OLS估计式不再具有最小方差特性(不同方法)
OLS估计式的方差不一定是最小的,即OLS估计式虽然无 偏,但不一定是最佳的(存在异方差时,可证明能够找到比 OLS 的方差更小的估计方法)
相关主题