第三讲 面板数据线性回归模型估计、检验和应用单因素误差面板数据线性回归模型对于面板数据y i 和X i ,称it it it y u α′=++X βit i it u v μ=+ 1,,;1,,i N t T ==""为单因素误差面板数据线性回归模型,其中,i μ表示不可观测的个体特殊效应,it v 表示剩余的随机扰动。
案例:Grunfeld(1958)建立了下面的投资方程:12it it it it I F C u αββ=+++这里,I it 表示对第i 个企业在t 年的实际总投资,F it 表示企业的实际价值(即公开出售的股份),C it 表示资本存量的实际价值。
案例中的数据是来源于10个大型的美国制造业公司1935-1954共20年的面板数据。
在Stata 中设定面板数据(GRUNFELD.dta ). xtset FN YRpanel variable: FN (strongly balanced)time variable: YR, 1935 to 1954delta: 1 unit混合回归模型假设1 u ~ N (0, σ2I NT )对于面板数据y i 和X i ,无约束的线性回归模型是y i = Z i δi + u i i =1, 2, … , N(4.1) 其中'i y = ( y i 1, … , y iT ),Z i = [ ιT , X i ]并且X i 是T×K 的,'i δ是1×(K +1)的,u i 是T×1的。
注意:各个体的回归系数δi 是不同的。
如果面板数据可混合,则得到有约束模型y = Z δ + u(4.2) 其中Z ′ = ('1Z ,'2Z , … ,'N Z ),u ′ = ('1u ,'2u , … ,'N u )。
在假设1下,对于Grunfeld 数据,建立的混合回归模型Stata 命令:. regress I F C_cons -42.71437 9.511676 -4.49 0.000 -61.47215 -23.95659C .2306785 .0254758 9.05 0.000 .1804382 .2809188F .1155622 .0058357 19.80 0.000 .1040537 .1270706I Coef. Std. Err. t P>|t| [95% Conf. Interval]Total 9359943.92 199 47034.8941 Root MSE = 94.408Adj R-squared = 0.8105Residual 1755850.43 197 8912.94636 R-squared = 0.8124Model 7604093.48 2 3802046.74 Prob > F = 0.0000F( 2, 197) = 426.58Source SS df MS Number of obs = 200. regress I F C 面板数据的可混合性检验推断面板数据可混合的零假设是:10H :对于所有的i 都有δi = δ. 检验约束条件的统计量是Chow 检验的F 统计量()()1res ures 'uresSSE SSE (N )K'F SSE N T K −−=−其中,1'K K =+,1N ures i i SSE SSE ==∑. 在10H 条件下,F obs ~ F [(N -1)K ′, N (T - K ′ )]分布。
对于Grunfeld 数据,在零假设10H 下,混合OLS 估计得到res SSE = 1755850.48;无约束模型的ures SSE 由10个公司的OLS 回归SSE 之和得到,即ures SSE = 324728.47,每个回归有17个自由度,总的自由度为170;共有27(=3*9)个约束;Chow 检验的F 统计量取值为27.75;经检验拒绝了所有系数可混合性的零假设10H 。
斜率系数的可混合性检验另外,还可以利用Chow 检验的F 统计量只斜率系数的可混合性进行检验(允许截距不完全相同),即检验零假设20H :β1 =β2 =,…,=βN 这时,有约束模型是带有个体虚拟变量的组内回归1,无约束模型与前面相同。
1对于面板数据固定效应回归模型 it it i it y x v αβμ=+++ (*)关于时间平均的模型被称为组间回归式 i i i i y x v αβμ=+++... (**) 用(*)式减去(**)式,得组内回归式()()it i it i it i y y x x v v β−=−+−....并且,模型(*)的GLS 估计量ˆˆ GLS Within Between=+ 12βW βW β.(Baltagi ,2008,P20)对于Grunfeld 数据,在零假设20H 下,组内估计得到res SSE = 523478;同样,无约束模型的ures SSE 由10个公司的OLS 回归SSE 之和得到,即ures SSE = 324728.47,每个回归有17个自由度,总的自由度为170;共有18(=2*9)个约束;得到F 统计量等于5.78;因此拒绝了斜率系数具有可混合性的零假设20H 。
类似地,还可以检验系数是否随时间变化的可混合性问题。
个体固定效应模型(Fixed-effects (FE) model )面板数据混合回归模型没有考虑不可观测的非时变异质因素,当考虑了这些因素对模型参数估计的影响时,需要把面板数据回归模型设定为个体固定效应模型。
面板数据回归模型 it it i it y x v αβμ=+++被称为固定效应回归模型。
其中,i μ即为不可观测的非时变异质因素。
估计方法:LSDV 估计、组内变换后的OLS 估计——组内估计。
Stata 命令:xtreg depvar [indepvars] if [weight] , fe [FE_options]. xtreg I F C,feF test that all u_i=0: F(9, 188) = 49.18 Prob > F = 0.0000rho .72525012 (fraction of variance due to u_i)sigma_e 52.767964sigma_u 85.732501_cons -58.74393 12.45369 -4.72 0.000 -83.31086 -34.177C .3100653 .0173545 17.87 0.000 .2758308 .3442999F .1101238 .0118567 9.29 0.000 .0867345 .1335131I Coef. Std. Err. t P>|t| [95% Conf. Interval]corr(u_i, Xb) = -0.1517 Prob > F = 0.0000F(2,188) = 309.01overall = 0.8060 max = 20between = 0.8194 avg = 20.0R-sq: within = 0.7668 Obs per group: min = 20Group variable: FN Number of groups = 10Fixed-effects (within) regression Number of obs = 200. xtreg I F C,fe保存固定效应模型. estimates store FEreg注:斜率系数的固定效应估计就是组内估计量,通常将固定效应估计称为组内估计量。
固定效应检验检验面板数据固定效应模型设定的零假设是:30H :μ1 = μ2 = … = μN-1=0. 检验约束条件的统计量是Chow 检验的F 统计量()()()()3011H res ures uresSSE SSE N F ~F N ,NT N K SSE NT N K −−=−−−−− 其中,,1N ures i i SSE SSE ==∑. 在30H 条件下,对应于混合回归模型,无约束模型是LSDV 回归模型。
如果N 较大,组内均值回归的残差平方和可作为ures SSE .对于Grunfeld 数据,F = 49.18,拒绝了混合回归模型的设定。
组间效应模型(Between-effects (BE) model)Stata 命令:xtreg depvar [indepvars] if , be [BE_options]. xtreg I F C,be _cons -8.527114 47.51531 -0.18 0.863 -120.883 103.8287C .0320315 .1909378 0.17 0.872 -.4194647 .4835276F .1346461 .0287455 4.68 0.002 .0666739 .2026183I Coef. Std. Err. t P>|t| [95% Conf. Interval]sd(u_i + avg(e_i.))= 85.02366 Prob > F = 0.0011F(2,7) = 21.11overall = 0.7551 max = 20between = 0.8578 avg = 20.0R-sq: within = 0.4778 Obs per group: min = 20Group variable: FN Number of groups = 10Between regression (regression on group means) Number of obs = 200. xtreg I F C,be保存组间效应模型. estimates store BEreg固定效应模型的缺陷z 固定效应模型的参数太多,影响估计自由度;z 固定效应模型的误差项含有未观测到的个体效应(μi ),并可能与X it 相关。
例如,在收入方程中,μi 可能代表不可观测的个人能力,它可能与方程右边的受教育变量相关。
个体随机效应模型(GLS random-effects (RE) model )面板数据回归模型it it i it y x v αβμ=+++,μi ~IID(0, σμ2),it v ~IID(0,σv 2),被称为随机效应回归模型。
其中,μi 是独立于it v ,对于所有的i 和t ,X it 也独立于μi 和it v .通过设定个体效应(μi )为随机误差项,并假设个体效应(μi )与X it 独立,以避免固定效应模型参数估计的有偏。