eviews上机第六章
⑴ 将样本按解释变量中可能出现异方差的序列进行排序(SORT X)并分成两部分 ⑵ 利用样本1建立回归模型1 ⑶ 利用样本2建立回归模型2 ⑷ 计算F统计量 F RSS2 / RSS1 , RSS1和RSS2 分别是模型1和模型 2的残差平方和 (5) 查F分布表得F值,进行观察得出是否存在异方差的结论
17
检验统计量是通过利用解释变量所有可能的交叉乘积对残差进行回归来计 算的。例如:假设估计如下方程
yi 1 2 xi 3 zi ui
式中:b是估计系数,û 是残差。 i
(6.1.6)
检验统计量基于辅助回归:
ˆ ui2 0 1 xi 2 zi 3 xi2 4 zi2 5 xi zi i
随着x增加,方差是否出现逐渐增 加、下降或者不规则变化。
15
练习2:
打开工作文件4-1,4-3 分别用两种图示演示法(x-y以及X - ûi2 )观察工作文件中的方程是否 存在异方差性 请根据图形判断随着x增加,方差出现增加、下降还是不规则变化 将截图保存至word文档,并辅以自己的分析解释 最后将word文档取名为学号+姓名,提交。
G-Q检验法可以同时克服这两大困难。因此,G-Q检验法 更为常用。
35
帕克检验具体步骤:
建立回归模型,得到原方程残差序列
生成新变量序列(其中一种常见形式):
GENR lnE2=log(RESID^2) GENR lnx=log(x)
建立新残差序列对解释变量的回归模型:LS lnE2 C lnx 观察lnx的系数及P值:
31
练习5:
打开工作文件4-1,和4-3
用G-Q法判定方程是否存在异方差性?
(其中:F0.05(8,8 )= 3.44 ,F0.05(5,5)=5.05)
32
4.Park检验法(帕克检验与戈里瑟检验)
33
34
帕克检验的不足:
需要选择不同的解释变量,尝试各种不同的函数形式,进行多次 反复试验 在进行试验的回归模型中,其随机干扰项本身就可能不满足普通 最小二乘的经典假设
25
操作中的具体问题:
1.如何将样本分为两部分? 2.如何观察F值得出结论?
26
如何将样本分为两部分
1.首先要将样本按X从小到大的顺序进行排列( SORT X ) 2.去除中间的一部分样本
3.将剩余的样本两等分,成为后续操作中的“样本1建
立模型1”和“样本2 建立模型2”
27
利用White检验法检验此回归方程是否存在异方差。
22
练习3-2:
打开工作文件4-3 建立被解释变量住房支出(y),解释变量年收入(x)的
OLS回归方程
利用White检验法检验此回归方程是否存在异方差。
23
3. Goldfeld-Quant检验法
24
G-Q检验具体步骤:
如果实际模型满足不了这些假定,普通最小二乘法就不再适用,而要发 展其他方法来估计模型。
3
§6.1 异方差
古典线性回归模型的一个重要假设:同方差
总体回归方程的随机扰动项 ui 同方差,即他们具有相同的方差 2
实际现象常常不符合严格的假设条件:
如果随机扰动项的方差随观测值不同而异,即ui 的方差为i2,就 是异方差。用符号表示异方差为E(ui2) = i2
验的另外一种形式,就是辅助回归中不包含交叉项。 因此White检验有两 个选项:交叉项和无交叉项。
19
例6.2:人均家庭交通及通讯支出(CUM)和可支配收入(IN ) 的回归方程的 White 异方差检验的结果:
该结果F 统计量和 Obs*R2 统计量的P值均很小,表明拒 绝原假设,即残差存在异方差性。
第六章:异方差,检验及其修正
1
线性回归模型的基本假设
yt 0 1 x1i 2 x2i k xki ui
i=1,2,…,N
在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提 出若干基本假设: 1.解释变量之间互不相关; 2.随机误差项具有0均值和同方差。即
EViews显示两个检验统计量:F统计量和 Obs*R2 统计量。
(6.1.7)
White检验的原假设:不存在异方差性(即式(6.1.7)中除0以外的所有系 数都为0成立)
18
White证明出:
N R 2 ~ k2
(6.1.8)
其中:N是样本容量,k为自由度,等于式(6.1.7)中解释变量个数(不包
30
如何观察F值得出结论?
计算F统计量:F RSS2 / RSS1 =A,其中 RSS1和RSS2分别是模型1和模型 2的残差平方和
确定一个临界值α (如1%,5%,10%),查F分布表得:
Fα (n1-k,n2-k)=B
如果A>B,即F值大于临界值,则存在异方差
如果A<B,即F值小于临界值,则不存在异方差
28
例如:假设存在一个30个观测值的样本, 首先将解释变量按从小到大进行排序 然后减去一个不超过1/3量的中间样本(不超过10个),为保持剩下 的可以平均分为2组,所以本例中应该去除8个中间样本。 因此,样本1为1-11,样本2为20-30
29
练习4:
假设存在一个观测值为40的样本,需要进行G-Q异方差检 验,请问如何进行样本分组?
含截距项)。如果计算的2值大于给定显著性水平对应的临界值,则可以 拒绝原假设,得出存在异方差的结论。也就是说,回归方程(6.1.7)的R2
越大,说明残差平方受到解释变量影响越显著,也就越倾向于认为存在异
方差。 如果原模型中包含的解释变量较多,那么辅助回归中将包含太变量太多时,必须谨慎一些。White检
E (ui ) 0
Var (u i ) 2
i=1,2,…,N
即随机误差项的方差是与观测时点t无关的常数; 3.不同时点的随机误差项互不相关(序列不相关),即
Cov(ui , ui s ) 0
s ≠ 0, i = 1 , 2 , … , N
2
4.随机误差项与解释变量之间互不相关。即
(GENR lnE2=log(RESID^2) 以及 GENR lnx=log(x))
异方差现象:
在许多应用中都存在,主要出现在截面数据分析中
4
实际经济问题与异方差性 几个例子:
5
收入与储蓄
6
收入与消费
7
产出与投入
8
表1 中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和 通讯支出 (单位:元)
变量 地区 甘 肃 山 西 宁 夏 吉 林 河 南 陕 西 青 海 江 西 黑龙江 内蒙古 贵 州 辽 宁 安 徽 湖 北 海 南 可支配收入 交通和通讯支出 IN 4009.61 4098.73 4112.41 4206.64 4219.42 4220.24 4240.13 4251.42 4268.50 4353.02 4565.39 4617.24 4770.47 4826.36 4852.87 CUM 159.60 137.11 231.51 172.65 193.65 191.76 197.04 176.39 185.78 206.91 227.21 201.87 237.16 214.37 265.98 变量 地区 新 河 四 山 广 湖 重 江 云 福 天 浙 北 上 广 疆 北 川 东 西 南 庆 苏 南 建 津 江 京 海 东 可支配收入 IN 5000.79 5084.64 5127.08 5380.08 5412.24 5434.26 5466.57 6017.85 6042.78 6485.63 7110.54 7836.76 8471.98 8773.10 8839.68 交通和通讯支出 CUM 212.30 270.09 212.46 255.53 252.37 255.79 337.83 255.65 266.48 346.75 258.56 388.79 369.54 384.49 640.56
系数不为0,且显著,则表示存在异方差性 反之,则表示不存在异方差性
36
练习6-1: 打开工作文件4-1 对原方程进行帕克检验
(GENR lnE2=log(RESID^2) 以及 GENR lnx=log(x))
检验是否存在异方差?
37
练习6-2: 打开工作文件4-3 对原方程进行帕克检验
Cov( x ji , u i ) 0
j=1,2,…,k, i=1,2,…,N
5.随机误差项服从0均值、同方差的正态分布。即
ui
~
N (0, 2 )
i=1,2,…,N
当随机误差项满足假定1 ~ 4时,将回归模型”称为“标准回归模型”
当随机误差项满足假定1 ~ 5时,将回归模型称为“标准正态回归模型”。
i2 exp( z iα)
i2 ( 2 z iα) m
,
~ ln( u i2 ) z iα i
③ Glejser异方差检验 ,
~ ui z iα i
21
练习3-1:
打开工作文件4-1 建立被解释变量人均家庭交通及通信支出(cum),解释
变量可支配收入(in)的回归方程
16
2. White检验法
White (1980) 提出了对最小二乘回归中残差的异方差性的检验。 两种检验:包括有交叉项和无交叉项(取默认值即可)。 普通最小二乘估计虽然在存在异方差性时是一致的,但是通常计算的 标准差不再有效。 如果发现存在异方差性,利用加权最小二乘法可以获得更有效的估计 (修正异方差)。