面板数据的F检验固定效应检验标准化工作室编码[XX968T-XX89628-XJ668-XT689N]面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。
时间序列数据或截面数据都是一维数据。
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据示意图见图1。
面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。
面板数据用双下标变量表示。
例如y, i= 1, 2, …, N; t= 1, 2, …, Ti tN表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,y, ( ii .= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。
图1 N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
对于面板数据y i t, i = 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。
注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。
例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。
数据是7年的,每一年都有15个数据,共105组观测值。
人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。
人均消费和收入的面板数据从纵剖面观察分别见图2和图3。
从横截面观察分别见图4和图5。
横截面数据散点图的表现与观测值顺序有关。
图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。
表1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996199719981999200020012002 CP-AH(安徽)CP-BJ(北京)CP-FJ(福建)CP-HB(河北)CP-HLJ(黑龙江)CP-JL(吉林)CP-JS(江苏)CP-JX(江西)CP-LN(辽宁)CP-NMG(内蒙古)CP-SD(山东)CP-SH(上海)CP-SX(山西)CP-TJ(天津)CP-ZJ(浙江)资料来源:《中国统计年鉴》1997-2003。
表2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)地区人均收入1996199719981999200020012002 IP-AH(安徽)IP-BJ(北京)IP-FJ(福建)IP-HB(河北)IP-HLJ(黑龙江)IP-JL(吉林)IP-JS(江苏)IP-JX(江西)IP-LN(辽宁)IP-NMG(内蒙古)IP-SD(山东)IP-SH(上海)IP-SX(山西)IP-TJ(天津)IP-ZJ(浙江)资料来源:《中国统计年鉴》1997-2003。
图2 15个省级地区的人均消费序列(纵剖面)图3 15个省级地区的人均收入序列(file:4panel02)图4 15个省级地区的人均消费散点图图5 15个省级地区的人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的消费值) (每条连线表示同一年度15个地区的收入值)用CP表示消费,IP表示收入。
AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
15个地区7年人均消费对收入的面板数据散点图见图6和图7。
图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。
相当于观察15个时间序列。
图7中每一种符号代表一个年度的截面散点图(共7个截面)。
相当于观察7个截面散点图的叠加。
图6 用15个时间序列表示的人均消费对收入的面板数据图7 用7个截面表示的人均消费对收入的面板数据(7个截面叠加)为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。
从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。
内蒙古2002年的收入与消费规模还不如北京市1996年的大。
图9给出该15个省级地区1996和2002年的消费对收入散点图。
可见6年之后15个地区的消费和收入都有了相应的提高。
图8 北京和内蒙古1996-2002年消费对收入时序图图9 1996和2002年15个地区的消费对收入散点图2.面板数据的估计。
用面板数据建立的模型通常有3种。
即混合估计模型、固定效应模型和随机效应模型。
混合估计模型。
如果从时间上看,不同个体之间不存在显着性差异;从截面上看,不同截面之间也不存在显着性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。
如果从时间和截面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立如下模型,y= a +b1 x it +e it, i= 1, 2, …, N; t= 1, 2, …, T (1)ita 和b不随i,t变化。
称模型(1)为混合估计模型。
1以例1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下:图10EViwes估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选New Object功能,从而打开New Object(新对象)选择窗。
在Type of Object选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口。
在窗口中输入15个地区标识AH(安徽)、BJ(北京)、…、ZJ(浙江)。
工具栏中点击Sheet 键,从而打开Series List(列写序列名)窗口,定义变量CP和IP,点击OK键,Pool (混合或合并数据库)窗口显示面板数据。
在Pool窗口的工具栏中点击Estimate键,打开Pooled Estimation(混合估计)窗口如下图。
图11在Dependent Variable(相依变量)选择窗填入CP;在Common coefficients(系数相同)选择窗填入IP;Cross section specific coefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗点击Common;在Weighting(权数)选择窗点击No weighting。
点击Pooled Estimation(混合估计)窗口中的OK键。
得输出结果如图10。
相应表达式是= +IP itR2 = , SSEr = 4824588,(103)=15个省级地区的人均支出平均占收入的76%。
如果从时间和截面上看模型截距都为零,就可以建立不含截距项的(a = 0)的混合估计模型。
以二变量模型为例,建立混合估计模型如下,yit= b1 x it +e it, i= 1, 2, …, N; t= 1, 2, …, T (2)对于本例,因为上式中的截距项有显着性(t = > (103) = ),所以建立截距项为零的混合估计模型是不合适的。
EViwes估计方法:在Pooled Estimation(混合估计)对话框中Intercept(截距项)选择窗中选None,其余选项同上。
固定效应模型。
在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。
固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。
下面分别介绍。
(1)个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。
如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显着性变化,那么就应该建立个体固定效应模型,表示如下,y= b1 x it +g1 W1 + g2W2 + … +g N W N+e it, t= 1, 2, …, T (3)it其中W=ie, i= 1, 2, …, N; t= 1, 2, …, T,表示随机误差项。
y it, x it, i= 1, 2, …, itN; t= 1, 2, …, T分别表示被解释变量和解释变量。
模型(3)或者表示为y= g1 +b1 x1t +e1t, i = 1(对于第1个个体,或时间序列),t= 1, 2, …, T 1ty= g2 +b1 x2t +e2 t, i = 2(对于第2个个体,或时间序列),t= 1, 2, …, T 2t…y= g N +b1 x N t +e N t, i = N(对于第N个个体,或时间序列),t= 1, 2, …, T N t写成矩阵形式,y= (1x1) +e1 = g1 +x1 b +e11…y= (1x N) +e N = g N + x N b+e NN上式中y i,g i,e i,x i都是N′1阶列向量。
b为标量。
当模型中含有k个解释变量时,b 为k′1阶列向量。
进一步写成矩阵形式,= + b+上式中的元素1,0都是T′1阶列向量。
面板数据模型用OLS方法估计时应满足如下5个假定条件:(1)E(e it|x i1, x i2, …, x iT, a i) = 0。
以x i1, x i2, …, x iT, a i为条件的e it的期望等于零。