5.2 面板数据模型理论5.2.1 面板数据模型及类型。
面板数据(panel data )也称时间序列截面数据(time series and cross sectiondata )或混合数据(pool data )。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据从横截面(cross section )上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列。
面板数据用双下标变量表示。
例如:it y , N i ,,2,1 =;T t ,,2,1 =其中,N 表示面板数据中含有的个体数。
T 表示时间序列的时期数。
若固定t 不变,•i y ),,2,1(N i =是横截面上的N 个随机变量;若固定i 不变,t y •,),,2,1(T t =是纵剖面上的一个时间序列。
对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data )。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data )。
面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模型。
面板数据模型的解析表达式为:it it it it it x y μβα++= T j N i ,2,1;,2,1==其中,it y 为被解释变量;it α表示截距项,),,,(21k it it itit x x x x =为k ⨯1维解释变量向量;'21),,,(k it it it it ββββ =为1⨯k 维参数向量;i 表示不同的个体;t 表示不同的时间;it μ为随机扰动项,满足经典计量经济模型的基本假设),0(~2μσμIIDN it 。
面板数据模型通常分为三类。
即混合模型、固定效应模型和随机效应模型。
⑴ 混合模型。
如果一个面板数据模型定义为:it it it x y μβα++= T j N i ,2,1;,2,1==则称此模型为混合模型。
混合模型的特点是无论对任何个体和截面,回归系数α和β都是相同的⑵ 固定效应模型。
固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regressionmodel )、时间固定效应模型(time fixed effects regression model )和时间个体固定效应模型(time and entity fixed effects regression model )。
① 个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。
如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么模型就称为个体固定效应模型立,表示如下,it it i it x y μβα++= T j N i ,2,1;,2,1==式中,y it 为被解释变量, ),,,(21k it it itit x x x x =为k ⨯1维解释变量向量,i α是随机变量,表示对于i 个个体有i 个不同的截距项,且其变化与),,,(21k it it itit x x x x =有关;),,,(21k ββββ =为1⨯k 维回归系数向量,对不同的个体回归系数相同,it μ为随机误差项,则称此模型为个体固定效应模型。
个体固定效应模型也可以表示为y it =1 D 1 +2 D 2 + … +N D N + x it +it μ t = 1, 2, …, T其中 ⎩⎨⎧==其他个个体如果属于第。
,,0,...,2,1,1N i D i i ② 时间固定效应模型。
如果一个面板数据模型定义为:it it t it x y μβα++= T j N i ,2,1;,2,1==式中,t α是随机变量,表示对于T 个截面有T 个不同的截距项,且其变化与),,,(21k it it it it x x x x =有关;对不同的个体回归系数相同,it μ为随机误差项,则称此模型为时间固定效应模型。
时间固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。
如果确知对于不同的截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时刻固定效应模型。
时间固定效应模型也可以表示如下y it =1 D 1 +2 D 2 + … +T D T + 1 x it +it , i = 1, 2, …, N其中⎩⎨⎧==)(,0,...,2,1个截面不属于第其他个截面如果属于第。
,t t T t D i③ 个体时间固定效应模型。
如果一个面板数据模型定义为it it t i it x y μβγα+++= T j N i ,2,1;,2,1==式中,i α是随机变量,表示对于N 个个体有N 个不同的截距项,且其变化与),,,(21k it it it it x x x x =有关;t γ是随机变量,表示对于T 个截面有T 个不同的截距项,且其变化与),,,(21k it it itit x x x x =有关;对不同的个体回归系数相同,it μ为随机误差项,则称此模型为个体时间固定效应模型。
⑶ 随机效应模型对于面板数据模型it it i it x y μβα++= T j N i ,2,1;,2,1==如果y it 为被解释变量,it x 为k ⨯1维解释变量向量,β为1⨯k 维回归系数向量,对不同的个体回归系数相同,t α是随机变量,其分布与it x 无关;it μ为随机误差项,则称此模型为个体随机效应模型。
同理也可以定义时间随机效应模型和个体时间随机效用模型。
5.2.2 面板数据模型估计方法面板数据模型中β的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随模型类型的设定是否正确,是否采用了相应正确的估计方法而变化。
面板数据模型中的解释变量it X 可以是时变的,也可以是非时变的。
⑴ 混合最小二乘估计混合最小二乘估计方法是在时间上和截面上把NT 个观测值混合在一起,然后用最小二乘法估计模型参数。
给定混合模型it it i it x y μβα++=,1,2,,;1,2,,i N t T ==如果模型是正确设定的,且解释变量与误差项不相关,即(,)0it it Cov X u =。
那么无论是N →∞,还是T →∞,模型参数的混合最小二乘法估计量都具有一致性。
对混合模型通常采用的是混合最小二乘估计。
然而,对于经济面板数据,即使在随机误差项it u 服从独立同分布条件下,由最小二乘法得到的方差协方差矩阵通常也不会满足假定条件。
因为对于每个个体i 及误差项it u 来说通常是序列相关的。
NT 个自相关观测值要比NT 个相互独立的观测值包含的信息少。
从而导致随机误差项it u 的标准差常常被低估,估计量的精度被虚假夸大。
如果模型存在个体固定效应模型,即i α与it X 相关,那么对模型应用混合最小二乘估计方法,估计量不再具有一致性。
⑵ 平均数最小二乘估计法平均数最小二乘(between OLS )估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N 个平均数估计值。
然后利用it y 和it X 的这N 组观测值估计回归参数。
以个体固定效应模型'it i itit y X u αβ=++ 为例,首先对面板中的每个个体求平均数。
令11,1,2,,T i it t y T yi N -===∑11,1,2,,T i it t u T ui N -===∑ 11,1,2,,T i it t X TX i N -===∑,(i X 是1k ⨯阶列向量)从而建立模型 ',1,2,,i i i i y X u i N αβ=++=变换上式得 '(),1,2,,i i i i y X u i N αβαα=++-+= 上式称做平均数模型。
对上式应用最小二乘估计,则参数估计量称做平均数最小二乘估计量。
此条件下的样本容量为N 。
如果i X 与()i i u αα-+相互独立,α和β的平均数最小二乘估计量是一致估计量。
平均数最小二乘估计法适用于短期面板的混合模型和个体随机效应模型。
对于个体固定效应模型来说,由于i α和it X 相关,也就是说i α和i X 相关,所以,回归参数的平均数最小二乘估计量是非一致估计量。
⑶ 离差变换最小二乘估计量对于短期面板数据,离差变换最小二乘(within OLS )估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离着观测值,然后利用离差变换数据估计模型参数。
以个体固定效应模型为例,'it i it it y X u αβ=++ 具体步骤是先对每个个体计算平均数yi 、i X ,可得到如下模型,'i i i i y X u αβ=++ 其中yi 、i X 、i u 为每个个体的平均。
上两式相减,消去了i α,得'()()it i it i it i y y X X u u β-=-+-此模型称做离差变换数据模型。
对离差变换数据模型应用最小二乘估计,11'11()()ˆ()()N T it i it i i t N T it i it i i t X X y y XX X X β====--=--∑∑∑∑ 所得ˆβ称做离差变换最小二乘估计量。
对于个体固定效应模型,β的离差变换最小二乘估计量是一致估计量。
如果it u 还满足独立同分布条件,β的离差变换最小二乘估计量不但具有一致性而且还具有有效性。
⑷ 可行广义最小二乘估计法(随机效应估计法)有个体随机效应模型'0()it iti it y X u αβα=-++ 其中0α为常数。
i α,it u 服从独立同分布。
对其做以下变换'0ˆˆˆ(1)()it i it i ity y X X v λλαλβ-=-+-+ 其中0ˆˆ(1)()it it iv u u λαλ=-+-渐近服从独立同分布,22/1ασσσλT u u +-=。
i y 、i X 、i u 的定义式见(15-14)。
对式(15-17)应用最小二乘估计,则所得β的估计量称为可行广义最小二乘估计量或随机效应估计量。
当ˆ0λ=时,式(15-17)等同于混合最小二乘估计;当ˆ1λ=时,式(15-17)等同于离差变换最小二乘估计。
对于随机效应模型,可行广义最小二乘估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,可行广义最小二乘估计量不是一致估计量。
在实际的经济面板数据中,N 个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。