当前位置:文档之家› 第九章_面板数据模型

第九章_面板数据模型

一、固定影响模型的设定
上一节给出了分析面板数据的一般模型
yit x it β ci uit
固定影响模型源于一般模型中被遗漏的影响 ci 与包括的变 量 xit相关的假设,此假设的一般形式是:
E[ci Xi ] h(Xi )
(9.6)
由于上式中的条件均值在所有时期中都相同,我们可将模 型写成:
1 u1 u 2 2 ... ... n u n

β y X d1 d 2 ... d n u α
(9.9)
这里 di是第i个单元为1其它单元为0的虚拟变量。设 nT n
这就是固定影响模型。从模型的设定可知,固定影响 模型假设横截面个体之间的差异为截距不同,而斜率系数 相同,即允许不同的横截面个体的截距是不同的,但每一 个体的截距在各个不同时期则保持不变。换句话说,固定 影响模型假定不同横截面个体的差异可用不同的常数项 i 来描述,在此模型中, i 被作为要估计的未知参数。
实际应用中,n 通常很大,数以千计,模型很可能超出 任何计算机的存储容量。可考虑使用分块回归技术以减少计 算量。有关分块回归技术的详细讨论参见Greene(2008)。 另一方面,运用LSDV估计固定影响模型,需要加入n个 虚拟变量,当模型中的虚拟变量的个数n很大时,回归中会 损失大量的自由度。解决这个问题的思路是对模型进行变换, 消去常数项 i ,再用变换后的模型回归。 为表达方便起见,不失一般性,我们用双变量模型来 说明。在这种情况下,模型(9.7)简化成:
E[ci xi1 , xi 2 ,...] h(xi1 , xi 2 ,...) h ( Xi )
假设条件放宽了,模型的适应也宽了,但复杂性也大 大增加了,因为需要有关函数性质的假设。
四、模型结构
我们将研究分析面板数据的各类模型,它们大致可分为 如下几种类型:
1.混合回归(pooled regression)
effects model)。在本章中,我们只介绍个体固
定影响模型。
3.随机影响(random effects)
如果未观测到的个体异质性可以被假定与包括在模型 中的变量无关,则模型可设定为
yit x it β E[ z i α ] {z i α E[ z i α ]} uit x it β i uit
yi i xit uit
1 y 定义 i T
,假定 uit ~ IN (0, 2 ) 。
y
t 1
T
it
,xi 1 T
x
t 1
2
T
it

yi,xi
称为组内均值。组内平方和及交叉乘积和为:
Wxxi Wxyi Wyyi
xit x
t t t it
如果进一步假设 Var (ci Xi ) 为常数,则在此假设下, (9.7)变成经典线性回归模型。
二、固定影响模型的参数估计
固定影响模型参数的估计方法有两种,一种
是最小二乘虚拟变量(LSDV)估计法,另一种是 组内估计(Within Estimator)或称协方差估计 (The Analysis of Covariance Estimation , ANCOVA)。下面介绍这两种参数估计方法。
用中, ci不可观测,处理起来就要复杂得多。
分析的主要目标是偏效应(partial effects)的一致和有 效估计:
β E[ yit xit ]/ xit
是否能达到这个目标取决于有关不可观测的影响的假 设。我们以自变量的严格外生性假设作为起点, 该假设为:
E[uit xi1 , xi 2 ,...] 0
(9.12)
这样在模型(9.12)中,常数项就被去掉了。令
y yit yi , X X it X i , u uit ui
则模型转换为*
yit X u
* it
* it
(9.13)
对模型(9.13)运用OLS进行回归,就得到 的OLS估计值。
2. 组内估计法
为表达方便起见,先考虑双变量模型
如果混合数据包含的观测值来自从一个大总体中随机抽样 的主体不同时期的数据,则此类混合数据称为非面板混合数据。 例如,我们每年对北京市固定的一万户家庭消费的观测记
录所得到的数据集就是面板数据;而我们每年对北京市居民家
庭随机抽样一万户家庭消费的观测记录所得到的数据集就是非 面板混合数据。在实践中,面板数据通常比非面板混合数据更 有用,这是因为面板数据中的地区、公司、人员等横截面个体 在各时期中一直保持不变,这使得我们更易于对这类个体随着
其中
(9.1)
t 1, 2,3,..., T
β ( 1 , 2 ,..., k ) α (1 , 2 ,..., m )
xit ( x1it , x2it ,..., xkit ) z i ( z1i , z2i ,..., zmi )
xit 中有k个解释变量,不包括常数项。异质性或个体
随机影响模型可看成是一个带有随机常数项的回归模
型。如果数据集足够丰富,我们可以将此思路扩展到其它
系数也随着个体随机变动的模型,从而得到随机系数模型:
yit x it (β hi ) ( i ) uit
(9.5)
其中 hi 是一个引起参数跨个体变动的随机向量。
第二节 固定影响模型
(9.4)
这是一个带复合扰动项的线性回归模型。可用OLS法估计, 得到一致但非有效的估计量。(9.4)称为随机影响模型。 这里 i 是一个反映横截面个体影响的随机元素。 固定影响模型和随机影响模型的关键区别是未观测到的 个体影响是否包含与模型中解释变量相关的元素,而不在于 这些影响是否随机。
4. 随机系数(random coefficients )
若 Z i中仅包含常数项,则模型形式如下:
yit x it β uit
(9.2)
这类模型假设所有的横截面个体在各个不同时期的斜 率和截距都是相同的,这样就可以直接把面板数据混合在 一起,用OLS估计参数,得到一致和有效估计量。 由于混合回归模型假设解释变量对被解释变量的影响 与横截面个体无关,这在现实中是很难成立的,所以应用 不广。
Intercepts)

第一节 面板数据与面板数据模型
一、面板数据
混合数据(pooled data)是指将横截面数据和时间
序列数据结合在一起的数据。
混合数据包含不同横截面个体不同时期的数据,或者
说,混合数据包含既跨越时间又跨越空间的数据。 如果混合数据包含的观测值来自同一批地区、公司、 人员或其它横截面个体的不同时期数据,则此类混合数据 称为面板数据(panel data)。
即当期扰动项与过去、现在和未来的每一期中的自变量都 无关。
模型关注的重要方面是异质性,这方面特别方便的一个 假设是所谓的均值独立(mean independence):
E[ci xi1 , xi 2 ,...]
如果该假设成立,即不可观测的变量与包括在模型中的 变量无关,那么下面将看到,可以将它们包括在模型的扰 动项中,这正是随机影响模型的基础假设。可是,这是一 个很强的假设,很多情况下无法满足。弱一些的假设是:
xi
xi yit yi
2
yit yi
i
再令 Wxx Wxxi , Wxy Wxyi , Wyy Wyyi
时间的推移所发生的变动进行比较和分析。
相应地,我们将基于面板数据的回归模型称为面板数据 模型(panel data model)。面板数据模型可以分为单方程 面板数据模型和联立方程面板数据模型;也可以分为线性面 板数据模型和非线性面板数据模型(如离散被解释变量面板
数据模型、受限被解释变量面板数据模型)。
二、面板数据模型的优点 1.利用面板数据进行的经济分析更全面 2.利用面板数据能够改进估计的有效性
三、分析面板数据的一般模型框架
分析面板数据的基本框架是形如下式的回归模型:
yit x it β z i α uit xit β ci uit i 1, 2,3,..., n
面板数据模型 综列数据模型 平行数据模型
本课程包括内容 变截矩模型(Variable-Intercept Models)
固定影响(Fixed-Effects) 随机影响(Random-Effects)

变系数模型(Variable-Coefficient Models) 动态变截矩模型(Dynamic Models with Variable
yit X it i uit
我们对第i个横截面个体在时间上求均值,则有
(9.10)
yi X i i ui
i 1, 2,3,..., n
(9.11)
(9.10)-(9.11),得
yit yi ( X it X i ) uit ui
* it * it * it
2.固定影响(fixed effects) 如果 z i 不可观测,但与 xit相关,则由于遗漏了有关变量, β
的OLS估计量是有偏和不一致的。可是在这种情况下,模型
yit x it β i uit
均值。这就是固定影响模型。
(9.3)
包含了所有可观测的影响,并且设定了一个可估计的条件 其中 i z i α 。固定影响模型将 i视为回归模型中每一个体各
1. LSDV估计法
设 y i和 Xi 为第i个横截面单元的T个观测值, i 是一个 元素全为1的 T 1 列向量, ui 为相应的扰动项 T 1 列向
量,则:
y i Xi β + ii + ui
相关主题