应用宏观经济学方法新进展--贝叶斯分析框架摘要: 本文回顾了应用宏观经济学的主要分析方法和最新进展。
现有校准、向量自回归、一般矩方法和极大似然估计等方法都存在诸多缺点,而贝叶斯分析框架的引入能有效地应对这些问题。
贝叶斯分析方法能很好地将微观文献和宏观研究相结合,将经济理论、数据和政策分析融为一体,而且很适合进行模型比较和政策分析。
基于我国转轨经济和宏观数据的特点,贝叶斯方法将在我国宏观经济建模和预测,中央银行制定和执行货币政策中发挥重要作用。
关键词:应用宏观经济学;贝叶斯分析;中国经济中图分类号:F015 文献标识码:A 文章编号:一、引言宏观经济学在上世纪30年代“凯恩斯革命”中成为独立的研究领域。
应用宏观经济学(或宏观计量经济学)一直是宏观经济学中最为活跃的研究领域之一,各种新思路、新方法层出不穷。
“凯恩斯革命”之后的几十年中,由凯恩斯理论导出的结构方程方法成为宏观经济学实证研究的主要方向。
但是70年代由于受到卢卡斯批判(Lucas critique)和宏观经济模型商业应用的冲击,考尔斯委员会(Cowles commission)结构性联立方程组模型逐渐失去其在应用宏观经济学中的统治地位。
80年代以后,由于Kydland and Prescott(1982)和Long and Plosser(1983)的开创性工作,第一代动态随机一般均衡(DSGE)模型以(Kydland and Prescott为代表的RBC模型)成为宏观经济学的主流理论方法,许多实证宏观计量方法也围绕如何估计和评价DSGE模型展开。
在实证宏观计量方法方面,经济学家提出了许多正式和非正式的数量方法,如向量自回归(VAR)方法、校准(calibration)方法、一般矩估计方法(GMM)及完全信息极大似然估计(MLE)方法等等。
为了减轻“经济理论施加的难以置信的限制”,Sims(1980)提出较少运用经济理论而以数据为中心的VAR方法,该方法自提出以来得到了广泛的运用,并成为宏观经济建模的基本分析工具。
DSGE模型是一个数据生成过程的多元随机表示系统,这使我们很容易将其近似表示为VAR模型。
但是,简单的DSGE模型对数据施加了很强的限制和约束条件,因而存在严重的模型误设定(mis-specificaiton)问题,这使得由DSGE模型所导出的VAR模型常常被实际数据所拒绝(An and Schorfheide,2007)。
正是由于模型误设定和识别等问题,经济学家们在80年代对DSGE模型的评价一直没有有效的正式统计学方法,这也是Kydland and Prescott(1982,1996)放弃正式的(概率)计量方法,转而使用非正式的计量方法-校准方法的原因。
与概率方法对计量经济模型的估计、检验和统计推断不同,校准方法通过选择宏观经济数据(如国内生产总值、通货膨胀等)的一些特征化事实(如一阶矩、二阶矩等),设定DSGE模型的参数使模型理论矩与观测到数据的相应矩(特征化事实)相一致,并验证模型能否解释剩下的特征化事实(如各种高阶矩)。
但是在校准方法中,参数值和特征化事实的选取往往是任意的,没有固定的选择程序;而且该方法没有参数估计结果的概率度量和统计检验。
上述问题都使得校准方法缺乏稳健性和统计推断能力,而对于引入大量刚性和冲击的大规模新凯恩斯主义DSGE模型来讲,校准方法就变得更加难以执行,而且上述缺点将变得更为严重。
Hansen(1982)提出的GMM方法则从一定程度上缓解了校准方法缺乏概率描述的缺点。
GMM方法从某些总体距条件(正交条件)出发,使样本距与总体距尽量相一致或靠近,以此估计模型参数。
但是由于工具变量的可获得性、小样本偏差和最优权重矩阵的估计等问题使得GMM方法缺乏可行性和稳健性。
而且在宏观经济运用中,由于该方法使用DSGE模型的欧拉方程矩条件而无需解出模型,这就使模型的识别问题显得更为突出(Canova,2007)。
Linde (2005)使用模拟数据发现即使没有测量误差,新凯恩斯主义菲利普斯曲线模型的GMM估计量在小样本时也有严重的偏差,而且偏差程度随货币政策行为的变化而变化,而此时完全信息极大似然估计则更具有吸引力。
传统的完全信息极大似然估计方法首先需要对DSGE模型的外生冲击设定一个概率分布,然后根据模型的结构方程推导出似然函数,并在一定的参数空间内极大化该似然函数。
Linde(2005)发现无论在模型误设定还是非正态测量误差条件下,完全信息极大似然估计都比有限信息方法(如GMM)表现更好。
但是由于DSGE模型非线性解的计算负担,使得大多数经验文献仅仅能估计线性化的DSGE模型。
而且非高斯扰动的DSGE模型、似然函数的扁平性(flatness)和多重局部极大值问题等也常常使得极大似然估计难以进行。
另外极大似然估计方法对模型误设定非常敏感,只有在模型有很好的线性近似,且模型误设定很小时才能运行良好。
同时宏观经济学家们通过不断引入一些更为实际的假定条件,使得模型的设定能进一步逼近现实经济运行,这大大改善了第一代DSGE模型的误设定问题,也使得一些传统的计量经济技术能用来估计、评价和预测DSGE模型。
如贝叶斯VAR方法、贝叶斯DSGE方法、基于DSGE和VAR冲击响应函数差距的最小距离估计方法等等,其中贝叶斯VAR和贝叶斯DSGE方法得到了学术领域和中央银行实际工作者的广泛认可。
二、贝叶斯分析方法贝叶斯分析方法是指在进行参数估计时,将参数的某些先验信息考虑进来,将这些先验信息与样本信息相结合,运用贝叶斯定理得出(或更新)参数估计的统计学方法①。
假定我们要估计的参数为θ,贝叶斯估计方法将其看作随机变量,并假定其概率密度为()p θ。
假定T Y 表示T 个随机样本观测值,则(|)T p Y θ为样本的条件概率密度,也是样本观测值的似然函数。
(,)T p Y θ为样本观测值和待估参数的联合概率密度函数,(|)T p Y θ为给定样本信息后参数θ的后验概率密度,由贝叶斯定理有:(,)(|)()(|)()T T T T p Y p Y p p Y p Y θθθθ== (1) 其中()0T p Y ≠。
由于()T p Y 与θ无关,可视为常数,将上面表达式写为:(|)()(|)T T p Y p p Y θθθ∝ (2) 其中∝表示“成比例”,即在给定样本信息后,待估参数的后验概率密度与参数先验概率密度和样本似然函数的乘积成比例。
该公式表明先验信息通过先验密度进入后验密度,样本信息通过似然函数进入后验密度,联合后验密度则将所有先验和样本信息归纳融合其中(Zellner ,1971)。
在贝叶斯观点下,待估计参数被看作随机变量,关于参数的推断都是以概率形式出现的,这使我们可以考虑尽可能大的参数空间,使模型的估计更为稳健。
许多数值模拟方法如马尔可夫链蒙特卡洛方法(Markov Chain Monte Carlo )都能被用来从参数后验分布中进行抽样,基于这些抽样我们可以通过数值方法来估计后验分布的各种矩,并对参数进行统计推断。
经济学家将贝叶斯观点运用到了许多宏观经济学模型中,近年最主要的进展是贝叶斯向量自回归(贝叶斯VAR )模型和贝叶斯动态随机一般均衡(贝叶斯DSGE )模型。
贝叶斯DSGE 和贝叶斯VAR 方法就是将先验信息引入DSGE 和VAR 模型,运用贝叶斯观点,使先验信息与数据信息相结合,进而对模型的参数进行后验推断和预测的一种统计推断方法。
贝叶斯DSGE 和贝叶斯VAR 方法不仅有贝叶斯估计方法的一般优点,相对于一般的DSGE 和VAR 模型,贝叶斯估计方法在模型的估计、评价和计算上也有较多优势。
而且贝叶斯估计方法将经济理论、数据和政策分析非常好地融为一体,已成为宏观经济建模和预测,欧、美国家中央银行制定和执行货币政策的基本分析框架。
最新出版的主流应用宏观经济研究方法教科书《Methods for①贝叶斯计量经济估计方法的综述可参见Zeller (1971)。
Applied Macroeconomic Research 》(Canova ,2007)中就有近三分之一的篇幅在讲授贝叶斯方法的基本原理和在宏观经济研究中的运用。
下面我们以贝叶斯VAR 模型和贝叶斯DSGE 模型为例,说明其基本原理和运用。
三、贝叶斯VAR 和贝叶斯DSGE 模型方法(一)贝叶斯VAR 模型方法80年代以后,经济学家广泛运用VAR 方法对时间序列进行分析、预测和政策分析。
但是,对于由标准DSGE 模型得出的限制性简约VAR 或拥有较小自由度的VAR 来讲,运用非限制性VAR 方法进行的实证估计往往不太准确,或预测时有很大的标准差,而且难以形成良好的经济学理论解释。
而当数据较少,或样本信息较弱,或待估计参数数量较多时,非限制性VAR 估计将带来过度拟和(overfitting )问题及因此导致的较差的预测效果(Canova ,2007)。
贝叶斯VAR 模型则可以很好地解决非限制性VAR 模型的样本外预测表现、模型误设定及数据和经济理论一致性等问题。
1. Minnesota 先验分布贝叶斯VAR 模型假定有T 个样本观测值的1n ⨯向量t y 有以下p 阶简约VAR 模型表示:011t t p t p t y y y u --=Φ+Φ++Φ+ (3)其中01,,,p ΦΦΦ 为VAR 系数参数,t u 为向前一步预测误差,(0,)t u u N ∑ 。
为了改善VAR 模型的样本外预测表现和识别问题,Doan ,Litterman and Sims (1984)和Litterman (1986)针对非限制性VAR 模型的系数参数提出了Minnesota (或 Litterman )先验分布。
定义01[,,,]p 'Φ=ΦΦΦ 、()vec α=Φ和1[,,]T T Y y y '= ,Minnesota 先验分布假定(0,)N αα∑ ,其中α是2(1)1n p +⨯向量,对角阵α∑是先验方差协方差矩阵,且是少数几个超参数(hyperparameter )的函数①。
实际上Minnesota 先验分布是按逐条方程对简约VAR 模型系数参数设定先验信息,因而在多方程结构VAR 模型占主要比重的宏观经济研究中有一定局限性。
针对多方程结构VAR 模型,Sims and Zha (1998)进一步发展了Litterman 的思想,使用“正态-逆Wishart ”先验分布作为结构参数的先验信息,该先验分布也适用于过度识别的结构VAR 模型。
在实证研究方面,Robertson and Tallman (1999)根据美国主要宏观经济数据,使用Minnesota 、扩展的Minnesota 和Sims and Zha (1998)等多种先验分布,证实带有先验分① 具体设定形式参见Doan ,Litterman and Sims (1984)或《Methods for Applied Macroeconomic Research 》(Canova ,2007)。