第14章 面板数据模型
第14章 面板数据模型
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
1
前言
什么是面板数据(Panel Data)? 面板数据的特征与优势? 面板数据模型的分类:静态与动态。 静态、动态面板数据模型如何进行估计?以及 估计量性质如何?
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
(14.3.2)
为解决虚拟变量的完全多重共线性,可直接估计模型:
* * Yit 1 D1 N DN 1 X it uit
(14.3.3)
如果 uit 是经典误差项,可以直接对(14.3.3)进行OLS估计。 并且
1 ˆ 0 N ˆ
i 1 N * i
1 ˆ ˆ i N
Yit 0 1 X 1it K X Kit it
(14.2.1)
it i t uit i 1,2,, N t 1,2,, T
E(i ) 0 E(t ) 0 E(i uit ) 0
E(t uit ) 0
固定效应:如果个体效应或时间效应与模型中的解 释变量相关。 随机效应:如果个体效应或时间效应与模型中的解 释变量不相关。 静态面板数据模型:解释变量中不含被解释变量 滞后项的模型。例如(14.2.1)。
面板数据:多个观测对象的时间序列数据所组 成的样本数据。
i 反映不随时间变化的个体上的差异性, 被称为个体效应 t 反映不随个体变化的时间上的差异性, 被称为时间效应。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
4
二、面板数据的特征及优势
面板数据的基本特征:其数据结构的二维性。
F
若随机效应为真时,豪斯曼检验统计量:
H ~ 2 (K )
(14.3.11)
自由度K为模型中解释变量(不包括截距项)的个数。 对模型(14.1.3)进行豪斯曼检验,结果为: H=4.1777, p值=0.2429。接受随机效应的原假设。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
ˆ ˆ ˆ ˆ ˆ ˆ H (F R )' ( F R )1(F R )
(14.3.10)
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
16
ˆ 其中: F ,ˆ R 分别为回归系数的LSDV估计向量,GLS估计 向量; ˆ ,ˆ R 分别为LSDV估计系数,GLS估计系数的协方差 矩阵估计量。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
9
§14.3 静态面板数据模型的估计
一、固定效应估计法
OLS估计量:有偏的,非一致的。 本质问题:个体效应(或时间效应)的内生性。 其BLUE是最小二乘虚拟变量(LSDV)法。 1、LSDV估计方法
基本思想:通过虚拟变量把个体效应(和时间效应)从误 差项中分离出来,使分离后剩余的误差项与解释变量不相 关,以便进行OLS估计。 估计步骤:如对 Yit 0 1 X it it it i uit i 1,2,, N (14.3.1)
t统计值 202.1297 35.3193 2.4289 0.4921 p值 0.0000 0.0000 0.0157 0.6230 思考: 比较GLS(14.3.9)和LSDV(14.3.5)的估计结果? 为什么在固定效应估计时没有考虑自相关问题?
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
(2)进行差分变换,Yi,t1 Yi,t 1 Yi,t 2与 it uit ui,t1 ,都包 含共同因素ui ,t 1 ,无法消除解释变量的内生性问题。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
19
2. LSDV估计的有偏和非一致性
14
二、静态面板数据模型的随机效应估计
OLS估计量:无偏的,但估计量有较大的方差。 本质问题:个体(或时间)效应导致了误差项自相关。 其线性无偏最优的估计方法是广义最小二乘法(GLS)。 举例:对模型(14.1.3)进行GLS估计,估计结果为:
l n(PICit ) 7.9436 0.41601ln(CSCit ) 0.0750RLTit+0.0007RCI it (14.3.9) +
5
面板数据的优势:
1.扩大信息量,增加估计和检验统计量的自由度。 2.有助于提供动态分析的可靠性。 3.有助于反映经济结构、经济制度的渐进性变化。
4.面板数据模型有助于反映经济体的结构性特征。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
6
三、面板数据模型的混合估计
15
三、豪斯曼检验
固定效应模型:LSDV估计量无偏;GLS估计量有偏。 随机效应模型:LSDV和GLS估计量都无偏,但LSDV估计量有较 大方差;。 固定效应模型:两种估计量的结果就有较大的差异。 随机效应模型:LSDV估计量和GLS估计量的估计结果就比较接 近。
豪斯曼检验假设: 原假设(H0):随机效应;备选假设(HA): 固定效应 检验统计量为:
t \i 1 2 T 1 X 11 X 12 X 1T 2 N X 21 X N 1 X 22 X N 2 X 2T X NT
时 间 序 列 数 据
横 截 面 数 据
图14.1.1 变量X的面板数据结构
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
Cit
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
3
例2. 农村居民收入分析
ln(PICit ) 0+1ln(CSCit ) 2 RLTit 3 RCI it it
(14.1.3)
it i t uit
i 1,2, N t 1,2,T
12
表14.3.1 个体效应的估计结果
地 区 北 京 天 津 个体效应 -0.1652 -0.1154 地 区 黑龙江 上 海 个体效应 0.1699 -0.0700 地 区 山 东 河 南 个体效应 -0.0614 -0.0325 地 区 贵 州 云 南 个体效应 0.0457 -0.0892
河 北
it i uit
(14.4.2)
E (i uit ) 0
18
其中: uit 为经典误差, E(i ) 0
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
一、动态面板数据模型的内生性问题
动态面板数据模型:存在固有的内生性。 GLS估计和LSDV估计:有偏的非一致的。 1. GLS估计的有偏和非一致性 (1)解释变量 Yi,t 1与误差项 it 都包含个体效应 i 。
u 为经典误差项
缺陷:假定个体间和不同时点的经济关系是同质的。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
7
举例:基于中国28个省市自治区1995~2005年的 面板数据,估计的结果为:
l n(PICit ) 7.8158 0.35911 (CSCit ) 0.2523 + ln RLTit-0.0104RCI it
Yit 1 D1 N DN it
X it 1 D1 N DN it
(14.3.6) (14.3.7) (14.3.8)
ˆ it 1ˆit uit
含义:变量Y的个体内离差对变量X的个体内离差进 行回归,并进行OLS估计。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
广 西
四 川
0.2091
-0.0712
宁 夏
新 疆
-0.1481
-0.3504
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
13
2. LSDV估计方法的直观含义 对模型(14.3.3),另一种等价的估计方法步骤:
(1)分别估计方程(14.3.6)和(14.3.7) (2)估计方程(14.3.8)
t统计值 310.5582 p值 0.0000
(14.3.5)
35.0807 0.0000 2.1178 0.0351 0.6352 0.5258
思考:比较LSDV结果(14.3.5)与混合OLS结果
(14.1.6)?判定系数 R 2?
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
面板混合OLS估计:直接把各时间序列或各横截面 数据混合起来进行估计。 对于模型(14.1.3),假定个体效应和时间效应为0, 则模型为:
ln(PIC) 0+1ln(CSC) 2 RLT 3 RCI u
PIC 其中: (PIC11
(14.1.5)
PIC1T PICit PICN1 PICNT ) '
17
§14.4 动态面板数据模型简介
动态面板模型:解释变量中包含被解释变量的滞后 项。 一般表述形式为:
Yit 0 1 X 1it K X Kit Yi,t 1 it
(14.4.1)
以下分析基于模型(14.4.1)的简化设定形式:
Yit Yi ,t 1 it
模型(14.4.2)可以表示为:
Yit 1 D1 N DN Yi ,t 1 uit
* Yi*t Yi*t 1 it , 等价于模型: ,