第五章经典单方程计量经济学模型:专门问题一、内容提要本章主要讨论了经典单方程回归模型的几个专门题。
第一个专题是虚拟解释变量问题。
虚拟变量将经济现象中的一些定性因素引入到可以进行定量分析的回归模型,拓展了回归模型的功能。
本专题的重点是如何引入不同类型的虚拟变量来解决相关的定性因素影响的分析问题,主要介绍了引入虚拟变量的加法方式、乘法方式以及二者的组合方式。
在引入虚拟变量时有两点需要注意,一是明确虚拟变量的对比基准,二是避免出现“虚拟变量陷阱”。
第二个专题是滞后变量问题。
滞后变量包括滞后解释变量与滞后被解释变量,根据模型中所包含滞后变量的类别又可将模型划分为自回归分布滞后模型与分布滞后模型、自回归模型等三类。
本专题重点阐述了产生滞后效应的原因、分布滞后模型估计时遇到的主要困难、分布滞后模型的修正估计方法以及自回归模型的估计方法。
如对分布滞后模型可采用经验加权法、Almon多项式法、Koyck方法来减少滞项的数目以使估计变得更为可行。
而对自回归模型,则根据作为解释变量的滞后被解释变量与模型随机扰动项的相关性的不同,采用工具变量法或OLS法进行估计。
由于滞后变量的引入,回归模型可将静态分析动态化,因此,可通过模型参数来分析解释变量对被解释变量影响的短期乘数和长期乘数。
第三个专题是模型设定偏误问题。
主要讨论当放宽“模型的设定是正确的”这一基本假定后所产生的问题及如何解决这些问题。
模型设定偏误的类型包括解释变量选取偏误与模型函数形式选取取偏误两种类型,前者又可分为漏选相关变量与多选无关变量两种情况。
在漏选相关变量的情况下,OLS估计量在小样本下有偏,在大样本下非一致;当多选了无关变量时,OLS估计量是无偏且一致的,但却是无效的;而当函数形式选取有问题时,OLS估计量的偏误是全方位的,不仅有偏、非一致、无效率,而且参数的经济含义也发生了改变。
在模型设定的检验方面,检验是否含有无关变量,可用传统的t检验与F检验进行;检验是否遗漏了相关变量或函数模型选取有错误,则通常用一般性设定偏误检验(RESET检验)进行。
本专题最后介绍了一个关于选取线性模型还是双对数线性模型的一个实用方法。
第四个专题是关于建模一般方法论的问题。
重点讨论了传统建模理论的缺陷以及为避免这种缺陷而由Hendry提出的“从一般到简单”的建模理论。
传统建模方法对变量选取的“偿试”性使得实际建模过程存在“数据开采”问题而受到质疑。
Hendry提出的约化建模型理论正是针对这一缺陷而提出的一套全新的建模理论。
该理论认为,在模型的最初设定上,就设立一个“一般”的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,然后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较“简单”的最终模型。
约化建模理论的主要优点就在于,提出了一个对不同先验假设的更为系统的检验程序;同时由于它的初始模型就是一个包括所有可能变量的“一般”模型,也就避免了过度的“数据开采”问题;另外,由于初始模型的“一般”性,所有研究者的“起点”都有是相同的,因此,在相同的约化程序下,最后得到的最终模型也应该是相同的。
本专题重点介绍了一个“一般”模型所应具有的基本特征、“从一般到简单”的约化过程、相关的非嵌套检验以及约化模型的准则。
二、典型例题分析例1.一个由容量为209的样本估计的解释CEO薪水的方程为Ln(salary)=4.59 +0.257ln(sales)+0.011roe+0.158finance +0.181consprod – 0.283utility(15.3) (8.03) (2.75) (1.775) (2.130) (-2.895)其中,salary 表示年薪水(万元)、sales表示年收入(万元)、roe表示公司股票收益(万元);finance、consprod和utility均为虚拟变量,分别表示金融业、消费品工业和公用事业。
假设对比产业为交通运输业。
(1)解释三个虚拟变量参数的经济含义;(2)保持sales和roe不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异。
这个差异在1%的显著水平上是统计显著的吗?(3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?写出一个使你能直接检验这个差异是否统计显著的方程。
解答:(1)finance的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的CEO要比交通运输业的CEO多获薪水15.8个百分点。
其他两个可类似解释。
(2)公用事业和交通运输业之间估计薪水的近似百分比差异就是以百分数解释的utility 的参数,即为28.3%。
由于参数的t统计值为-2.895,它大于1%显著性水平下自由度为203的t分布的临界值1.96,因此这种差异是统计上显著的。
3(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为15.8%与18.1%,因此它们间的差异为18.1% - 15.8% = 2.3%。
一个能直接检验这一差异是否显著的方程为u trans utilty consprod roe salse salary ++++++=321210)ln()ln(αααβββ其中,trans 为交通运输业虚拟变量。
这里对比基准为金融业,因此1α表示了消费品工业与金融业薪水的百分数差异,其t 统计值可用来进行显著性检验。
例2.假设货币需求关系式为t t t M Y R αβγ*=++,式中,t M 为时间t 的实际现金余额;t Y *为时间t 的“期望”实际收入;t R 为时间t 的利率。
根据适应规则,11(1)t t t t Y Y Y λλμ**--=+-+,01λ<<修改期望值。
已知t Y ,t M ,t R 的数据,但t Y *的数据未知。
(1)建立一个可以用于推导,,αβγλ和估计值的经济计量模型。
(2)假设221()0,(),()0,0;,,t t t t s t t E E E s Y R μμσμμ--===≠1t M -和1t R -与t μ都不相关。
OLS 估计值是1)无偏的;2)一致的吗?为什么?(3)假设t μ=1,t t ρμε-+t ε的性质类似(2)部分。
那么,本例中OLS 估计值是1)无偏的;2)一致的吗?为什么? 解答: (1)由于t t t M Y R αβγ*=++ (1) 11(1)t t t t Y Y Y λλμ**--=+-+ (2)第二个方程乘以β有11(1)t t t t Y Y Y βλβλββμ**--=+-+ (3)由第一个方程得t t t R M Y γαβ--=*11*1-----=t t t R M Y γαβ代入方程(3)得t t t t t t R M Y R M βμγαβλλβγα+---+=-----)()1(111整理得1(1)t t t M Y R ααλλβγ-=--++11(1)(1)t t t M R λλγβμ-----+=111(1)(1)t t t t t Y M R R αλλβλγλγβμ---++-+--+该模型可用来估计并计算出,,αβγλ和。
(2)在给定的假设条件下,尽管t μ与t M 相关,但t μ与模型中出现的任何解释变量都不相关,因此只是μ与M 存在异期相关,所以OLS 估计是一致的,但却是有偏的估计值。
(3)如果t t t ερμμ+=-1,则1t M -和t μ相关,因为1t M -与1-t μ相关。
所以OLS 估计结果有偏且不一致。
3、一个估计某行业ECO 薪水的回归模型如下μββββββ++++++=comten ceoten profm mktval sales salary 543210arg)ln()ln()ln(其中,salary 为年薪sales 为公司的销售收入,mktval 为公司的市值,profmarg 为利润占销售额的百分比,ceoten 为其就任当前公司CEO 的年数,comten 为其在该公司的年数。
一个有177个样本数据集的估计得到R 2=0.353。
若添加ceoten 2和comten 2后,R 2=0.375。
问:此模型中是否有函数设定的偏误? 解答:若添加ceoten 2和comten 2后,估计的模型为μββββββββ++++++++=2726543210arg)ln()ln()ln(comten ceoten comten ceoten profm mktval sales salary如果β6、β7是统计上显著不为零的,则有理由认为模型设定是有偏误的。
而这一点可以通过第三章介绍的受约束F 检验来完成:97.2)8177/()375.01(2/)353.0375.0(=---=F在10%的显著性水平下,自由度为(2,∞)的F 分布的临界值为2.30;在5%的显著性水平下,临界值为3.0。
由此可知在10%的显著性水平下拒绝β6=β7=0的假设,表明原模型有设定偏误问题;而在5%的显著性水平下则不拒绝β6=β7=0的假设,表明原模型没有设定偏误问题。
5三、习题(一)基本知识类题型 5-1.解释下列概念: 1) 虚拟变量 2) 虚拟因变量模型 3) 滞后变量 4) 滞后效应5) 分布滞后模型 6) 自回归模型 7) h 检验8) 有限最小二乘法5-2.在建立计量经济模型时,什么时候、为什么要引入虚拟变量? 5-3.举例说明虚拟变量在模型中的作用。
5-4.什么是“虚拟变量陷阱”? (二)基本证明与问答类题型5-5.对包含常数项的季节变量模型运用最小二乘法时,如果模型中引入4个季节虚拟变量,其估计结果会出现什么问题?5-6.滞后外生变量模型和滞后内生变量模型的概念是什么?5-7.滞后变量模型有哪几种类型?外生变量分布滞后模型使用OLS 方法存在哪些问题? 5-8.产生模型设定偏误的主要原因是什么?模型设定偏误的后果以及检验方法有哪些? 5-9.试在消费函数εβα++=X Y 中(以加法形式)引入虚拟变量,用以反映季节因素(淡、旺季)和收入层次差异(高、中、低)对消费需求的影响,并写出各类消费函数的具体形式。
5-10.现有如下估计的利润函数:ii i t XD D X Y 0037.063.784537.037.221ˆ+++= )78.35( )86.8( )86.2(其中:Y 、X 分别为销售利润和销售收入;D 为虚拟变量,旺季时1=D ,淡季时0=D ;D X XD ⋅=,试分析:(1)季节因素的影响情况;(2)写出模型的等价形式。
5-11.如何确定有限分布滞后模型中的滞后期长度?5-12.被解释变量对于一个或者多个解释变量反应滞后的原因是什么?给出一些分布滞后模型的例子。
5-13.简述约化建模理论与传统建模理论的联系与区别;变量的外生性概念在约化建模理论与传统建模理论中有何不同?5-14.局部调整方法用于多元回归模型会出现什么问题?5-15.在计量经济模型定式中,解释变量设定误差有几类?各有什么特点?5-16.在实际建模中如何保证约化过程的有效性?人们有时将约化建模理论称为“TTT 方法论”,意思是“检验、检验、再检验”,谈谈你对此的看法。