当前位置:
文档之家› 计量经济学讲义——线性回归模型的异方差问题1
计量经济学讲义——线性回归模型的异方差问题1
ndiv = 248 .8055 + 0 .206553 * Atprofits se = ( 31 .89255 )( 0 .049390 ) t = ( 7 .801368 )( 4 .182100 ) p = ( 0 . 00000 )( 0 .00060 ), R 2 = 0 .507103
Gleiser检验与Park检验存在同样的弱点。
(9.3) (9.4) (9.5)
9.4 异方差的诊断-方法4:怀特(White)检验法
Yi = B1 + B 2 X 2 i + B3 X 3 i + u i
2、做如下辅助回归: (9.6) (9.7)
1、首先用普通最小二乘法估计方程(9.6),获得残差ei
E(Y|X)=α+β*X Y
+u +u -u -u -u +u
0
同方差(homoscedasticity)
X 0
E(Y|X)=α+β*X
异方差(heteroscedasticity)
X
一元线性回归分析-回归的假定条件
假定5 无自相关假定,即两个误差项之间不相关。 Cov(ui,uj) = 0。
ui
9.2 异方差的性质
例9.1 美国创新研究:销售对研究与开发的影响 ^ R&D = 266.2575 + 0.030878*Sales se=(1002.963) (0.008347) t =(0.265471) (3.699508) p =(0.7940) R2 = 0.461032 从回归结果可以看出: (1)随着销售额的增加,R&D也逐渐增加,即销售 额每增加一百万美元,研发相应的增加3.1 万美元。 (2)随着销售额的增加,R&D支出围绕样本回归线 的波动也逐渐变大,表现出异方差性。 (0.0019)
一元线性回归分析-总结(回归系数的计算公式)
整理得到由两个关于a、b的二元一次方程组成的方程组:
Σy = na + bΣx 2 Σxy = aΣx + bΣx
进一步整理,有:
b = a =
∑ ∑ ∑
n
xi yi x y
2 i
=
∑
(X
∑
i
− X )( Y i − Y ) (X
9.2 异方差的性质
例9.1 美国创新研究:1988年美国研究与开发费用支出
Sales R&D 6375. 3 11626 .4 1466 5.1 2186 9.2 62.5 92.9 178. 3 258. 4
Profi t 185. 1 1596 .5 276. 8 2828 .1
Sales R&D Profit 80552 .8 95249 .0 10131 4.1 11614 1.3 6620. 1 3918. 6 1595. 3 6107. 5 1386 9.9 4487. 8 1027 8.9 8787. 3
σ 2 ∑ x2
E (b ) = β
σ2
a与b均为服从正态分布的随机变量
a ~ N (α ,
∑ (x − x)
2
),
b ~ N (β ,
∑ (x − x)
2
)
一元线性回归分析-总结(相关系数与回归系数的差别) b与r的关系:
r>0 > b>0 >
r<0 < b<0 <
x y
r=0 b=0
S r = b S
ui
ui
uj
uj
uj
正相关
负相关
不相关
一元线性回归分析-回归的假定条件
假定6 回归模型是正确设定的,即实证分析的模型不 存在设定误差或设定错误。 假定7 在总体回归函数中,
y =α + β x+u
误差项u服从均值为0,方差为σ2的正态分布。即 u ~ N(0,σ2) 中心极限定理 独立同分布的随机变量,随着变量个 数的无限增加,其和的分布近似服从正态分布。
σˆ =
2
∑
e i2
n−2
3.2 一元线性回归分析-
普通最小二乘估计量的方差与标准误差
系数估计量的误差 :是既然估计量是通过样本计算出来的, 因此随着样本的变化,这些估计量是存在抽样变异性的 ,其 变异性是由估计量的方差或其标注误差 来度量。
var( a ) = σ st . e ( a ) = var( b ) = σ st . e =
ei2 = A1 + A2 X 2 i + A3 X 3 i + A4 X 22i + A5 X 32i + A6 X 2 i X 3 i + v i
3、求辅助回归方程(9.7)的R2值,在不存在异方差的原假设 下,怀特证明了从方程(9.7)中得到的R2值与样本容量(n)的 积服从χ2分布,自由度等于方程(9.7)中解释变量的个数。
n ∗ R 2 ~ χ k2−1
(9.8)
9.4 异方差的诊断-方法4:怀特(White)检验法
n ∗ R 2 ~ χ k2−1
(9.8)
4、如果从方程(9.8)中得到的χ2值超过了所选显著水平的χ2 临界值,或者说计算χ2的p值很低,则拒绝原假设:不存在 异方差。p值大,则不能拒绝原假设。
9.4 异方差的诊断-方法4:怀特(White)检验法
异方差性-回归问题的引入
虽然古典线性回归模型强调了同方差假定,但在实践 中无法保证总能够满足。本章内容就是讨论同方差假 定不满足条件下,回归模型可能会出现的问题,以及 如何解决问题: 1. 异方差有什么性质? 2. 异方差的后果是什么? 3. 如何诊断存在异方差? 4. 如果存在异方差,如何解决?
ei2 = − 2482 .57 + 10 .16896 * atp − 0 .00855 * atp * atp R 2 = 0 . 179238
样本容量为19,自由度为2,19*0.179238=3.41则 χ22=2.77(α=25%) < 3.41< χ22=4.61(α=10%), 存在异方差的可能性还是较大的。
计量经济学讲义
线性回归模型的异 方差问题
9.1 一元线性回归分析-总结(一元线性回归的思想)
ˆ 总体一元线性回归方程:Y
(估计的回归方程) 样本一元线性回归方程: (一元线性回归方程)
= E (Y | X
)= α
+ βX
以样本统计量估计总体参数
ˆ y = a + bx
截距 斜率(回归系数)
ˆ y 表示总体均值 E (Y | X )的估计量, a = α 的估计量, b = β 的估计量 估计量或样本估计量是 总体参数的估计公式。
i
− X )2
Σx − b = y − b x n
一元线性回归分析-总结(最小二乘法的优良性质 )
残差之和为零
∑e = 0
所拟合直线通过样本散点图的重心 ( x , y ) 误差项与解释变量不相关
∑ (e − e )( x − x ) = 0
a与b分别是总体回归系数的无偏估计量
E (a ) = α
(9.1)
在许多情况下,是无法知道σi2的,因此就用ei代替ui,建立 如下回归模型:
ln e = B1 + B2 * ln X i + vi
2 i
(9.2)
ei2可以从原始回归模型中得到。
9.4 异方差的诊断-方法2:帕克(R.E.Park)检验法
帕克检验步骤: Park检验的弱点在哪? 1. 做普通最小二乘回归,不考虑异方差问题; 2. 从原始回归方程求得残差ei,并求其平方,再取对数形式; 3. 利用原始模型中得一个解释变量做形如(9.2)的回归,如果 有多个解释变量,则对每个解释变量做形如(9.2)的回归, 或者做ei2对Y估计值的回归; 4. 检验零假设B2=0,即不存在异方差。如果lnei2和lnXi之间 是统计显著的,则拒绝零假设,表示存在异方差的可能。 5. 如果接受零假设,则回归方程中的B1可以理解为同方差 σi2的一个给定值。
9.4 异方差的诊断-方法2:帕克(R.E.Park)检验法
如果存在异方差,则异方差σi2可能与一个或多个解释变量 系统有关。是否相关,做σi2对一个或多个解释变量X的回归。 例如,在一元回归模型中进行如下回归:
lnσ i2 = B1 + B2 * ln X i + vi
其中,vi是残差项。此即为帕克检验。
2 a
=
n∑ (X
∑
σ
X
i
2 i
− X )2
•σ
2
var( a )
2 b
=
2
∑
(X
i
− X )2
σ2是误差扰 动项u的方差, 但是在多数情 况下它是未知 的。
var( b )
9.4 异方差的诊断-方法1:图形检验法
例子 不同收入阶层人群的消费状况。不同收入阶层的消 费方差很可能是不同的。 异方差的诊断方法: 1、残差的图形检验:即考虑解释变量X与误差ei之间的关系。 从例9.1看出随着Sales增大,误差ei的平方呈逐渐增大趋势。
#43;β*X
0
X
一元线性回归分析-回归的假定条件
假定4 误差扰动项u的方差为常数,即Var(u)=σ2,称 之为同方差(homoscedasticity) 同方差的含义:每个Y值以相同的方差分布在其均值周 围,即Y偏离其均值的程度相同。 Y
+u +u -u -u -u +u
9.4 异方差的诊断-方法3:格莱泽(Glejser)检验法
该检验方法实际上与帕克检验方法类似,从原始模型 中获得残差ei后,格莱泽所做的回归模型的方程不同,他采 取的是下列函数形式:
| ei |= B1 + B2 * X i + vi | ei |= B1 + B2 * X i + vi 1 | ei |= B1 + B2 * + vi Xi