eviews教程第25章时间序列截面数据模型
(3) 对转换后变量使用OLS (X 包括常数项和回归
量x ) (25.12) 其中。
EViews在输出中给
出了由(3)得到的的参数估计。
使用协方差矩阵的标准估计量计算
标准差。
EViews给出了随机影响的估计值。
计算公式为: (25.13) 得到的是的最优线性无偏预测值。
最后,
EViews 给出了加权和不加权的概括统计量。
加权统计量来自(3)中的
GLS 估计方程。
未加权统计量来自普通模型的残差,普通模型中包括
(3)中的参数和估计随机影响: (25.14) 三、截面加权当残差具有截面异方差性和
同步不相关时最好进行截面加权回归: (25.15) EViews进行FGLS ,并且从一阶段Pool 最小
二乘回归得出。
估计方差计算公式为: (25.16) 其中是OLS 的拟合值。
估计系数值和协方差矩阵
由标准GLS 估计量给出。
四、SUR 加权当残差具有截
面异方差性和同步相关性时,SUR 加权最小二乘是可行的GLS 估计量: (25.17) 其中是同步相关的对称阵: (25.18) 一般项,在所有的t 时为常
数。
EViews估计SUR 模型时使用的是由一阶段Pool
最小二乘回归得到: (25.19) 分母中的最大值函数是为了解决向下加权协方差项产
生的不平衡数据情况。
如果缺失值的数目可渐进忽略,这种方法生成
可逆的的一致估计量。
模型的参数估计和参数协方差矩阵计
算使用标准的GLS 公式。
五、怀特(White )协方差估计在Pool 估计中可计算怀特的异方差性一致协方差估计(除了SUR 和
随机影响估计)。
EViews 使用堆积模型计算怀特协方差矩阵: (25.20) 其中K 是估计参数总数。
这种方差估计量足以解释各截面
成员产生的异方差性,但不能解释截面成员间同步相关的可能。
* *
第二十五章时间序列/截面数据模型在经典计量经济学模型
中,所利用的数据(样本观测值)的一个特征是,或者只利用时间序
列数据(time series) ,或者只利用截面数据(cross section) 。
我们
经常遇到在同一时间包含不同截面成员信息的数据,或在若干时间区
间观测到相关的一些截面成员的数据。
例如许多欧洲国家的GDP 时间
序列数据,或者是一段时间不同地区的失业状态数据。
我们称这些数
据为联合利用时间序列/截面数据(Pooled time series,cross
section )。
有的书中也称这类数据为面板数据(panel data) ,指在时
间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样
本数据。
处理时间序列/截面数据的EViews 对象称为一个Pool 。
EViews 提供了许多专用工具处理Pool 数据,包括数据管理,选择时
间序列长度和截面成员的多少,以及进行数据估计。
本章将主
要介绍怎样建立Pool 数据以及定义和处理Pool 对象。
§25.1
Pool 对象 Pool对象的核心是建立用来表示截面成员的名
称表。
为明显起见,名称要相对较短。
例如,国家作为截面成员时,
可以使用USA 代表美国,CAN 代表加拿大,UK 代表英国。
定义
了Pool 的截面成员名称就等于告诉了EViews ,模型的数据结构。
在
上面的例子中,EViews 会自动把这个Pool 理解成对每个国家使用单
独的时间序列。
必须注意,Pool 对象本身不包含序列或数据。
一个Pool 对象只是对基本数据结构的一种描述。
因此,删除一个Pool
并不会同时删除它所使用的序列,但修改Pool 使用的原序列会同时
改变Pool 中的数据。
一、创建Pool 对象在本章中,使用
的是一个研究投资需求的例子,包括了五家企业和三个变量的20个
年度观测值的时间序列: 5家企业: 3个变量: CM:通用汽车公司 I :总投资CH :克莱斯勒公司 F :前一年企业的市
场价值 GE:通用电器公司 S :前
一年末工厂存货和设备的价值 WE :西屋公司 US :美国钢铁公司要创建Pool 对象,选择Objects/New
Object/Pool…并在编辑窗口中输入截面成员的识别名称:对
截面成员的识别名称没有特别要求,但必须能使用这些识别名称建立
合法的EViews 序列名称。
此处推荐在每个识别名中使用“_”字符,
它不是必须的,但把它作为序列名的一部分,可以很容易找到识别名
称。
二、观察或编辑Pool 定义要显示Pool 中的截面
成员识别名称,单击工具条的Define 按钮,或选择
View/Cross-Section Identifiers 。
如果需要,也可以对识别名称列
进行编辑。
三、使用Pool 和序列 Pool中使用的
数据都存在普通EViews 序列中。
这些序列可以按通常方式使用:可以列表显示,图
形显示,产生新序列,或用于估计。
也可以使用Pool 对象来处理各单独序列。
四、序列命名在Pool 中使用序列的关键是序列命名:使用基本名和截面识别名称组合命名。
截面识别名称可以放在序列名中的任意位置,只要保持一致即可。
例如,现有一个Pool 对象含有识别名_JPN ,_USA ,_UK ,想建立每个截面成员的GDP 的时间序列,我们就
使用“GDP ”作为序列的基本名。
可以把识别名称放在基本名的后面,此时序列名为GDP _JPN ,GDP _USA ,GDP _UK ;或者把识别名称放在基本名的前面,此时序列名为JPN _GDP ,USA _GDP ,UK _GDP 。
把识别名称放在序列名的前面,中间或后面并没什么
关系,只要易于识别就行了。
但是必须注意要保持一致,不能这样命名序列:JPNGDP ,GDPUSA ,UKGDP1,因为EViews 无法在Pool 对象中识别这些序列。
五、Pool 序列一
旦选定的序列名和Pool 中的截面成员识别名称相对应,就可以利用这些序列使用Pool 了。
其中关键是要理解Pool 序列的概念。
一个Pool 序列实际就是一组序列, 序列名是
由基本名和所有截面识别名构成的。
Pool 序列名使用基本名和“?”占位符,其中“?”代表截面识别名。
如果序列名为GDPJPN ,GDPUSA ,GDPUK ,相应的Pool 序列为GDP? 。
如果序列名为JPNGDP ,USAGDP ,UKGDP ,相应的Pool 序列为 ?GDP。
当使用一个Pool 序列名时,EViews 认为将准备使用Pool 序列中的所有序列。
EViews 会自动循环查找所
有截面识别名称并用识别名称替代“?”。
然后会按指令使用这些替
代后的名称了。
Pool 序列必须通过Pool 对象来定义,因为如果没有
截面识别名称,占位符“?”就没有意义。
§25.2 输入Pool 数据有很多种输入数据的方法,在介绍各种方法之前,首先要理解时间序列/截面数据的结构,区别堆积数据
和非堆积数据形式。
时间序列/截面数据的数据信息用三维表示:时期,截面成员,变量。
例如:1950年,通用汽车公司,投资数据。
使用三维数据比较困难,一般要转化成二维
数据。
有几种常用的方法。
一、非堆积数据存在工作文件的数据都是这种非堆积数据,
在这种形式中,给定截面成员、给定变量的观测值放在一起,但和其他变量、其他截
面成员的数据分开。
例如,假定我们的数据文件为下面的形式:其中基本名I 代表
企业总投资、F 代表前一年企业的市场价值、S 代表前一年末工厂存货和设备的价值。
每
个企业都有单独的I 、F 、S 数据。
EViews会自动按第四章介绍的标准输入程序读取非
堆积数据。
并把每个截面变量看作一个单独序列。
注意要按照上述的Pool 命名规则命名。
确认后EViews 会打开新建序列的堆积式数据表。
我们看到的是按截面成员堆积的序列,Pool 序列名在每列
表头,截面成员/年代识别符标识每行:二、堆积数据选择View/Spreadsheet (stacked data ),EViews 会要求输入序列名列表 Pool数据排列成堆积形式,一个变
量的所有数据放在一起,和其他变量的数据分开。
大多数情况下,不同截面成员的数据从
上到下依次堆积,每一列代表一个变量:我们称上表数据是以截面成员堆积的,单击Order+/-实现堆积方式转换,也可以按
日期堆积数据:每一列代表一个变量,每一列内数据都是按年排列的。
如果数据按
年排列,要确保各年内截面成员的排列顺序要一致。
三、手工输入/剪切和粘贴可以通
过手工输入数据,也可。