面板数据模型一、 面板数据的概念面板数据是时间序列数据和截面数据相结合的二维数据,为方面起见,暂且将之统称为TC 数据(即时间截面二维数据的意思),以我国31个省份1991-1999年的GDP 数据为例,则每一个年度称为一个截面,每个省份称为一个个体,每一个年度的31个省份的GDP 数据(31个)就是截面数据,每一个省份的9年的GDP 数据(9个)就是时间序列数据,即GDP 这个变量在时间维度有9个取值,在截面维度有31个取值,这些数据合在一起就是TC 数据,共31*9=279个。
如果每个截面包含相同数量的个体,则称之为平衡TC 数据,否则为非平衡TC 数据。
面板数据的主要优点有:1. 有利于降低多重共线性程度。
增加数据纬度的同时也增加了样本容量,样本容量增加可以增加变量之间的差异,降低变量间的相关程度,从而降低共线性程度。
2. 可以进行模型效应分析,更准确地理解统计结果的实际含义。
二、 面板数据模型的种类面板数据模型分为Pooled Data 模型和Panel Data 模型二类,Pooled Data 模型适用于研究时期较多个体较少的TC 数据,须为每个个体命名,研究目的侧重于个体差异或时期趋势;Panel Data 模型适用于研究个体较多、时期较少的TC 数据,不须为每个个体命名,研究目的侧重于由时期差异或个体推断总体。
另外,Pooled Data 模型允许各时期的个体不相同,Panel Data 模型要求各时期的个体相同。
例如: pooled datat=1:A B C D F t=2:A B D E panel datat=1:A B C D E t=2:A B C D E 三、 模型的基本形式 1. Pooled Data 模型it it it it it x y εβα++=,T t N i ,,1;,,1 ==…………① 2. Panel Data 模型()it it it it x f y εβα++=,T t N i ,,1;,,1 ==…………① 其中,()it x f β可以是非线性的。
比较分析:由于研究目的不同,所以前者允许系数可变,后者假定系数不变。
四、 模型形式的分类根据模型是否存在个体效应(即不同的个体是否有不同的模型),可分为效应模型和无效应模型两类,其中,Pooled Data 模型的效应模型又分为变系数模型和变截距模型两种;Panel Data 模型的效应模型只有变截距模型一种。
所以,Pooled Data 模型有3种,Panel Data 模型只有2种。
1. 效应模型(1) 变系数模型 如果对不同的i (t ),it α和it β都不相同,则称为个体(时期)效应变系数模型,可表示为:it it i i it x y εβα++=…………② 或:it it t t it x y εβα++=变系数模型等价于在模型中纳入“单独的个体哑变量项”和“个体哑变量与自变量的交叉项”来体现个体差异。
该模型用于描述:x 和y 的关系不仅在个体之间存在显著差异,而且x 对这种差异有显著影响,或者说,x 是产生这种差异的影响因素。
这种结论是普通回归模型难以得到的(因为代表个体的哑变量须设置很多“二分变量”)。
(2) 变截距模型 如果对不同的i (t ),只是it α不相同,但it β相同,则称为个体(时期)效应变截距模型,可表示为: it i it it y x u αβ=++…………③ 或:it it t it x y εβα++= 变截距模型等价于在模型中纳入“单独的个体哑变量项”来体现个体差异。
该模型用于描述:x 和y 的关系在不同个体存在显著差异。
2. 无效应模型如果对不同的i (t ),it α和it β都相同,则称为混合模型,可表示为: it it it y x u αβ=++…………④该模型用于描述:x 和y 的关系与个体或时期均无关。
模型效应包括固定效应和随机效应2种,当个体就是总体时,则称之为固定效应模型(FE );当个体是来自总体的随机样本时,则称之为随机效应模型(RE )。
对于平衡数据,Eviews 可以估计“双向FE”或“双向R E”,非平衡数据则不能。
五、 模型选择1. 模型形式选择(1) Pooled Data 模型形式选择-F 检验 1) 假设:01H :假设模型为变截距模型 02H :假设模型为混合模型 2) 统计量()()()2111/1/1S S N K F S N T K --⎡⎤⎣⎦=--⎡⎤⎣⎦~()()1,1F N K N T K ---⎡⎤⎣⎦()()()()3121/11/1S S N K F S N T K --+⎡⎤⎣⎦=--⎡⎤⎣⎦~()()()11,1F N K N T K -+--⎡⎤⎣⎦ 其中,S 1、S 2、S 3分别表示变系数模型、变截距模型和混合模型的残差平方和,N 是样本个数,K 是外生变量个数,T 是时期总数。
(注:S 1和S 2均采用FE 模型计算,可从回归结果中取得,然后手工计算F 1和F 1) 3) 检验规则 (A ) 如果F 2小于临界值(p 值大于0.05),则不否定H 02,应选择混合模型; (B ) 如果F 2、F 1均大于临界值(两个p 值均小于0.05),则否定H 02和H 01,应选择FE 变系数模型; (C ) 如果F 2大于临界值但F 1小于临界值(F 2的p 值小于0.05,但F 1FE 变截距模型。
[参考]F 检验的Eviews 操作:◊ 估计变系数模型(无约束模型),做F 检验(View/Fixed/Random Effects Testing/Redundant Fixed Effects- Likelihood Ratio 下同),P 值记为p1;估计变截距模型(相对混合模型而言,也是无约束模型),做F 检验,P 值记为p2。
◊ 当p1<临界值时,则否定“约束”,故采用变系数模型◊ 当p1>临界值,但p2<临界值时,则否定“截距”约束,但不否定“斜率”约束,故采用变截距模型 ◊ 当p1、p2都>临界值时,则不否定“截距”约束,也不否定“斜率”约束,故采用混合模型(2) Panel Data 模型形式选择- Likelihood Ratio 检验Panel Data 模型形式包括变截距模型(效应模型)和混合模型(无效应模型)两种。
1) 假设0H :模型为混合模型(约束模型),1H :模型为FE 变截距模型(未约束模型)2) 统计量()()()()k n nT n F k n nT S n S S F -------=,1~/1/112 式中,S 1、S 2分别表示FE 变截距模型和混合模型的残差平方和。
如果p 值小于0.05,则拒绝原假设,选择FE 变截距模型,反之则选择混合模型。
Eviews 操作:先估计FE 变截距模型,然后做Likelihood Ratio 检验(View/Fixed/Random Effects Testing/Redundant Fixed Effects – Likelihood Ratio.)。
如果P 值<0.05,则拒绝混合模型,接受FE 变截距模型。
注:(1)Panel data 模型的混合模型是在Panel Options 页的效应定义菜单中选择“None ”选项来设置。
(2)该检验也适合于Pooled Data 模型中的混合模型和FE 变截距模型之间的选择。
由于变系数模型太复杂,实际应用很少采用,因此一般只考虑是采用混合模型还是FE 变截距模型。
该检验也称为“F 检验”、“FE 显著性检验”等。
2. 模型效应选择前面在选择模型种类时都是按照FE 计算的,而RE 模型的含义更具有普遍性,所以如果可能的话,应尽量采用RE 模型的结果。
由于软件的局限,模型效应的选择目前只适合于变截距模型,不适合于变系数模型,变系数模型就不用选择了,一律采用FE 。
变截距模型效应可按照下列步骤选择: (1) 根据研究对象和目的不同作定性选择如果研究对象就是样本/个体本身,目的也是比较样本之间的特点,或样本量和时期数都较小时,则应选择FE ;如果研究对象是总体,目的是通过样本推断总体,则应选用RE 。
(2) Hausman 检验(RE 合理性检验)Eviews 操作:先估计RE 模型,然后做Hausman 检验(View/Fixed/Random Effects Testing/Correlated Random Effects - HausmanTest.)。
如果P值<0.05,则拒绝原假设“RE与解释变量不相关”,即拒绝采用RE模型。
参考:不相关的假设下,固定效应和随机效应模型是一致的,但固定效应不具有效性;反之,则随机效应模型不具一致性,而应采用固定效应模型。
六、模型估计1.异方差如果存在个体/时期异方差(例如,个体/时期个数大于时期/个体个数时),在Eviews中可选用“个体/时期加权回归法”(cross-section/period weight)估计模型。
2.自相关如果同时存在个体/时期异方差和自相关,在Eviews中可选用“个体/时期近似不相关加权回归法”(cross-section/period SUR)估计模型。
七、单位根检验和协整检验1.单位根检验共6种检验方法,按照原假设不同可分为三类:(1)假设存在相同单位根。
LLC(Levin, Lin & Chu),Breitung(2)假设存在不同的单位根。
IPS(Im, Pesaran, Shin),ADF-Fisher,PP-Fisher(3)假设不存在相同的单位根。
Hadri参考:只要有两种不同的单位根检验方法(相同根与不同根检验)检验结果不存在单位根就可以接受“序列平稳”,不要求所有检验都通过。
Eviews操作:在pool对象窗口中,View\Unit Root Test2.协整检验如果基于单位根检验的结果发现变量之间是同阶单整的,即可进行协整检验。
通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。
因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。
Pedroni、Kao、Johansen的方法。
零假设是没有协整关系Eviews操作:在pool对象窗口中,View\Cointegration Test八、Eviews操作举例[例1]建立我国城镇居民消费函数的面板数据模型(数据文件:E:\zy\统计学\时间序列\ pooldata.wf1或paneldata.wf1)。
在excel中按如下格式输入数据,并保存为paneldata.xls。