当前位置:文档之家› 第九章多元线性回归异方差问题

第九章多元线性回归异方差问题

实例:采用该方法修正6-1模型的异方差性
22
(一)加权最小二乘法
OLS是加权最小二乘法的特例 显然,当满足同方差假定时, w1 = w2 = = wn = 1/ = 常数 即权数相等且等于常数,加权最小二乘法,就是OLS法。
23
纠正异方差性的一个可行程序
(1)将y对x1, x2,…xk做回归并得到残差u; (2)将残差进行平方,然后再取自然对数而得到log(u2); (3)做log(u2)对x1, x2,…xk的回归并得到拟合值g; (4)求拟合值的指数:h=exp(g) (5)以1/h为权数用WLS来估计方程。 在(3)中做log(u2)对 y, y2 的回归本质上是完全一样的
2000
0
-2000
-4000
-6000
-8000
5
10
15
20
25
30
RESID
38

2 1


2 2

Ω Varε Eεε







2 n

2
两变量线性回归模型的异方差
Y
0
Xi
X
Xj
3
1、异方差的定义
异方差主要出现在截面数据分析中,例如大公司的利 润变化幅度要比小公司的利润变化幅度大,即大公司利润 的方差比小公司利润的方差大。这取决于公司的规模、产 业特点和研究开发支出多少等因素。又如高收入家庭通常 比低收入家庭对某些商品的支出有更大的方差。 例6-1:人均家庭支出(cum)和可支配收入(in)的关系模型
Var(ui)=σ2 * xi 其中σ2为常数,这时可以令权序列
wi 1/ xi
(2)误差方差与xi2成比例 Var(ui)=σ2 * xi2
其中σ2为常数,这时可以令权序列 wi 1/ xi
19
(一)加权最小二乘法
方差已知的情形 实例:住房支出模型
给出由四组家庭住房支出和年收入组成的截面数据, 建立住房支出模型,并检验和修正异方差。

根据图形中的分布选择
l 1,1或 1 2
2、再检验零假设 =0(不存在异方差)。如果零假设
被拒绝,则表明可能存在异方差。
10
(四)怀特检验
假设有如下模型:
yi B0 B1x1i B2 x2i ui (3)
基本步骤: 1、首先用OLS方法估计回归方程(3)式。 2、然后作辅助回归:
16
(一)加权最小二乘法
方差已知的情形
假设已知随机误差项的方差为var(ui)= i2 , 设权数wi与异 方差的变异趋势相反, wi =1/i,, 将原模型两端同乘以wi。
wi使异方差经受了“压缩”和“扩张”变为同方差。
17
(一)加权最小二乘法
方差已知的情形
对于一元线性回归模型y=b0+b1x+u,加权最小化残差平方
price 0 1lotsize 2sqrft 3bdrms
发现:采用水平模型存在异方差性,但采用对数模型不 存在异方差性。
14
三、异方差的解决方法
加权最小二乘法 模型的重新设定
15
(一)加权最小二乘法
基本思路:赋予残差的每个观测值不同权数,从而 使模型的随机误差项具有同方差性。
X
32
异方差:残差随收入增大而增大
2000
1000
0
-1000
-2000
5
10
15
20
25
30
RESID
33
4、异方差模型的估计
加权最小二乘法 在分析收入对储蓄的影响的时候,权数变量可以
选取 hi=inci
于是基本模型savi=a0+a1 inci+ei变为
savi / inci a0 (1/ inci ) a1 inci
i

1 Var
r 0 r x1 i r 0 r1xi
i


2r0
r0
r1xi
r1xi


2
21
(一)加权最小二乘法
(4)用随机误差项的近似估计量求权重序列 首先利用OLS估计原模型得到残差序列 ui ,然后利
用残差序列的绝对值的倒数序列作为加权序列, 即令
wi 1/ ui
给出中国1998年各地区城镇居民平均每人全年家庭交 通及通讯支出(cum)和可支配收入(in)的数据,估计两者 之间的关系模型
4
2、异方差的影响
1、OLS估计量不再是BLUE,其是无偏和一致的,但并 非有效的,即不再具有方差最小性。
2、检验假设的统计量不再成立,建立在t分布和F分布之 上的置信区间和假设检验不可靠。
3、利用原始模型中的解释变量作形如上式(2)的回归,记
下这个回归的R平方Ru22 。
4、检验零假设是
H0 :1 2 k 0
对方程(2)进行F检验,或计算LM统计量进行检验。
LM

Hale Waihona Puke nR2 u2
~

2 k
9
(三)戈里瑟检验
1、通常拟合
e

X
之间的回归模型:
j
e

X
l j
24
实例: 采用Wooldridge中的数据Smoke.Raw中的数据来估计一 个对日香烟消费量的需求函数。 基本回归模型如下: cigs=a0+a1log(income)+a2log(cigpric)+a3educ +a4age+a5age2+a6restaurn 其中cigs为每天吸烟的数量; income为年收入; cigpric 为每包香烟的价格(以美分为单位);educ为受教育年 数;age为年龄;restaurn为一个二值变量(若此人居住 的州禁止在餐馆吸烟,则取值1,否则取值0)。
12
等价的White检验
(1)用OLS估计模型(3),得到残差和拟合值,计算它 们的平方;
(2)做回归
u2 0 1 y 2 y2 v
记下这个回归的R平方
(3)构造F或LM统计量并计算p值(前者为 F2,n-3分布,
后者用

2 2
分布。
13
(五) 实例
使用Wooldridge中的数据HPRICE.RAW中的数据 来检验一个简单的住房价格方程中的异方差性。水平 变量模型为(分别采用水平变量和其对数项分别进行 回归分析)
5
二、异方差的发现和判断
(一)残差的图形检验 (二)帕克检验(Park test) (三)戈里瑟检验(Glejser test) (四)怀特检验(White test)
6
(一)残差的图形检验
这是一种最直观的方法,它以某一变量(通常取因变 量)作为横坐标,以随机项的估计量e或e2为纵坐标, 根据作出的散点图直观地判断是否存在相关性。如果 存在相关性,则存在异方差。通常的方法是先产生残 差序列,再把它和因变量一起绘制散点图。 例6-2:利用该方法绘制上一章关于美国机动车消费量 的模型中QMG与残差的散点图。
600 400 200
0 -200 -400 -600
0
10000 20000 30000 40000 X
30
3、异方差检验 图示法检验: 残差平方与自变量呈比较典型的喇叭型
31
250000
200000
150000
RESID2
100000
50000
0
0
10000 20000 30000 40000
34
同质性
权数序列名 Proce=>Equation=>Option=>选定异方差、给出权数名==>OK
35
加权最小二乘法估计结果
36
加权最小二乘法残差与X的散点图
RESID
600 400 200
0 -200 -400 -600
0
10000 20000 30000 40000 X
37
WLS处理后的残差图
第九章 多元线性回归的异方差问题
一、异方差及其影响 二、异方差的发现和判断 三、异方差的解决方法
1
一、异方差及其影响
1、异方差的定义:
对于多元线性回归模型,如果随机扰动项的方差并非是
不变的常数,则称为存在异方差(heteroscedasticity)。
异方差可以表示为
Var
i



2 i
。或

和为
2
wi2
2
i
wi2
yi b0b1xi
获得的估计量就是加权最小二乘估计量。对于多元线性回
归模型y=Xβ+u,令权数序列wi =1/i ,W为N×N对角矩 阵,对角线上为wi ,其他元素为0。则变换后的模型为
Wy WX Wu
18
(一)加权最小二乘法
方差已知的情形 (1)误差方差与xi成比例
(3)其他的与自变量xi的加权形式f(xi)
f xi r0 r1xi
20
(一)加权最小二乘法
方差已知的情形
Var(
)
i


2 i


2

r
0

r
x1 i

y i

b0
b1xi
r0 r1xi r0 r1xi r0 r1xi
i
r0 r1xi

Var
7
(二)Breusch-Pagan检验
假设回归模型如下:
Y 0 1x1 2 x2 k xk u
相关主题