第1章 绪论计量经济学的含义:一定的经济理论和实际统计资料为依据,运用数学、统计学方法和计算机技术,通过建立计量经济模型,定量的分析经济变量之间的随即因果关系。
计量经济学研究的经济关系具有两个特征:一是随机关系,产出与生产要素投入、消费与收入、投资与收入和利率之间都不是精确的函数关系。
二是因果关系,计量经济模型中的每一个(随机)方程都是反映某个经济变量与其影响因素之间的因果关系。
计量经济学的研究步骤:建立理论模型、估计模型中的参数、检验估计的模型和应用模型进行定量分析。
1. 建立理论模型其任务是依据经济理论和对所研究经济系统的认识,将系统内各经济变量之间的相互关系用一组(或一个)数学方程表示出来。
这一阶段的工作又称为模型设定。
模型设定一般包括总体设定和个体设定。
总体设定的目标是能正确反映经济系统的运行机制。
个体设定的目标是能正确反映经济变量之间的因果关系。
①确定模型中的变量计量经济学中一般将方程中的变量分为两类,方程等号左端的变量称为被解释变量,有端的变量称为解释变量,即用这些变量来解释或说明被解释变量的变化情况(回归分析中称为因变量和自变量)。
建立理论模型时,主要是确定模型中的解释变量,一般时根据经济理论和经验确定被解释变量的主要影响因素。
②确定模型中的函数形式确定模型中的函数形式一般有两种方式,一种方式是根据经济行为理论,运用数理经济学的研究方法推导出模型的具体数学形式。
另一种方式是根据实际统计资料绘制被解释变量和解释变量的相关图,由相关图显示的变量之间的相关关系确定模型的数学形式,这也是目前经常采用的方式。
③确定统计指标并搜集整理数据需要根据模型中变量的含义和统计数据的可得性,模型的研究目的,以及统计数据的可比性和一致性等因素进行综合考虑,以确定适当的统计指标。
建立计量经济模型的统计数据主要有三种类型:时间序列数据,即按时间先后顺序排列的数据,时间频率可以是年、季、月、日等;横截面数据,即某一时点上的数据;合并数据,即时间序列与横截面数据的混合数据。
2.估计模型中的参数建立理论模型之后,需要根据实际统计资料估计出模型中各个参数的具体数值,即得到一个估计的计量经济模型,这样才能定量描述经济变量之间的数量关系。
3.检验估计的模型具体的检验内容包括:①经济检验:主要是检验参数估计值的符号以及数值的大小在经济意义上是否合理。
②统计检验:主要是利用数理统计中的推断统计方法,对估计结果的可靠性进行检验。
一般包括拟合优度检验、模型的显著性检验、解释变量的显著性检验等。
③计量经济检验:主要用于检验模型的计量经济学性质,如回归模型的假设条件检验,模型的识别性检验等。
④预测性能检验:主要检验模型参数估计量的稳定性,以及模型对样本期以外客观事实的近似描述能力(即所谓的超样本特性)。
4.应用模型计量经济模型主要有以下几个方面的用途。
①结构分析:即分析经济变量或结构参数的变动对整个经济系统的影响。
②经济预测:由于计量经济预测是根据事物变化的原因进行预测即为因果预测,而且预测模型可以同时考虑多个经济变量之间的多种因果关系。
③政策评价:即利用计量经济模型定量分析政策变量变化对经济系统运行的影响。
④实证分析:即利用计量经济模型和实际统计资料实证分析某个理论假说的正确与否。
计量经济研究的四个步骤可以进一步概括成:经济系统 计量经济模型 经济问题广义计量经济学与狭义计量经济学:广义计量经济学是利用经济理论、数学和统计定量研究经济现象的数量经济方法统称,内容包括回归分析、时间序列分析、投入产出分析,等等。
狭义计量经济学就是我们通常定义的计量经济学,主要研究经济变量之间的随机因果关系,采用的数学方法主要是在回归分析基础上发展起来的计量经济方法。
计量经济模型的类型:单方程模型与联立方程模型如果模型系统只包含一个方程,即只研究某一个经济关系,则称该模型为单方程模型。
如果模型系统涉及到多个经济关系而需要构造多个方程,则称该模型为联立方程模型。
随机方程与恒等方程恒等方程中没有随机误差项。
计量经济学主要研究经济变量之间的随机关系,所以单方程模型都是随机方程。
静态模型与动态模型只考虑本期变量之间相互关系的模型为静态模型;如果模型中引入了滞后变量,如前期收入、前期投资、前期利率等,则模型成为动态模型。
第二章 回归模型总体回归直线方程: 称为总体回归方程,常数称为总体回归(或回归系数)。
回归分析的主要任务就是设法求出总体回归参数的具体数值,进而利用总体回归方程描述和分析总体的平均变化规律。
只有了解总体的整个概率分布情况,才能确定总体回归方程。
但是在现实经济生活中,往往无法获取总体的所有资料,只能通过对总体的若干次观察得到总体的一个样本,再依据样本信息来估计总体回归方程。
虽然样本的观察值并没有完全落在总体回归直线上,但样本是从总体中随机抽取的,必然包含总体的信息,散点分布仍然呈现出明显的线性趋势;设法确定一条直线来较好地拟合这些样本观察值,称这条直线为样本回归直线,其对应的方程:称为样本回归方程,分别为总体回归参数的估计。
如果估计误差较小,即的值与总体回归参数比较接近,则可以用样本回归方程来近似的代替总体回归方程,即利用样本回归方程近似地描述总体的平均变化规律。
因此,回归分析的主要内容可以概括成:根据样本观察值确定样本回归方程;检验样本回归方程对总体回归方程的近似程度;利用样本回归方程分析总体的平均变化规律。
随机误差项设定:1. 随机误差项总体回归方程只是反映了总体的平均变化规律,单个家庭的消费支出与平均消费支出之间存在着一定的离差,将这个离差用表示,即:或 其中,是一个不可观测的、可正可负的随机变量,所以称之为随机误差项。
相应的,若样本回归方程为,则实际值与估计值的离差用表示,即: 称为残差(或拟合误差),它可以作为随机误差项的估计。
2. 产生随机误差的原因模型中被忽略因素的影响。
模型函数形式的设定误差。
数据的测量与归并误差和随机因素的影响(如自然灾害等)引入随机误差项后,之间的关系式就表示成以下形式:这就是一元回归模型的一般形式,或称为回归模型的随机设定形式。
以这种形式描述之间的关系有明确的意义:第一,误差的随机性使得之间呈现出一种随机的因果关系,由于经济变量之间大多是不确定的相关关系,因此,用这种形式描述经济关系更加准确、合理。
第二,的取值由两部分组成,一部分是总体的平均值,其 变化由模型中的解释变量来决定,可以称之为“系统内影响”;另一部分是随机误差,主要反映了那些对有影响、但又未能包括到回归模型中的所有因素的综合影响,可以称之为“系统外影响”。
因此,回归模型的随机设定形式更加全面地反映了被解释变量y的变化情况。
古典回归模型的基本假设:1. 解释变量x为非随机变量,即在重复抽样过程中,x取值是可控的、固定的。
2. 零均值假定:,即随机误差项的平均值为零。
在此假定下,才有:回归方程才能反映总体的平均变化趋势,否则将会差生系统误差。
3. 同方差假定:(常数),即各个随机误差项的离散程度(或变动幅度)是相同的。
4. 非自相关协定:,即随机误差项之间是互不相关、互不影响的。
这样可以独立考虑各个水平下随机误差项的影响。
5. 解释变量与随机误差项不相关假定,,即解释变量与随机误差项互不相关,彼此对立的对y产生影响。
在假定1成立的情况下,该假定自动成立。
6. 无多重共线性假定,即解释变量之间不存在完全的线性关系,这样才能分析每个解释变量对y的单独影响。
最小二乘法估计(OLS)1. 选择最佳拟合曲线的标准可以确定为:是总的拟合误差(即总残差)达到最小。
其中最常用的就是普通最小二乘法:所选择的回归模型应该使所有观察值的残差平方和达到最小。
即:2. 由于:是关于的二次函数并且非负,所以存在最小值。
解得:其中:在Eviews软件命令窗口中直接键入CREATE命令,也可以建立工作命令。
命令格式为:CREATE 时间频率类型 起始期 终止期在Eviews软件的命令窗口中,可以直接键入LS命令来估计模型。
命令格式为:LS 被解释变量 C 解释变量3. 最小二乘估计的性质参数估计量的评价标准:无偏性。
设是参数的估计量,如果,则称是的无偏估计。
无偏估计保证了参数估计值是在真实值(简称参数真值)的左右波动,并且“平均位置”就是参数的真值。
有效性(最小方差性)。
设、均为参数的无偏估计量,若,则称比有效;如果在的所以无偏估计中,最小,则称为有效估计量。
有效性衡量了参数估计量与参数真值平均离散程度的大小。
如果估计量是有效估计,则参数估计值不仅在参数真值左右波动,而且波动幅度最小,这样参数估计值就很可能接近于参数真值。
一致性。
这是估计量的一个大样本性质,如果随着样本的增加,估计量越接近于真值,则称是的一致估计。
严格的说,是依概率收敛于,即:其中,为一个任意小的正数。
4. 系数的估计误差与置信区间系数的估计误差估计误差即估计值与真值的偏差,随着抽样的不同,误差大小是一个随机变量,因此考虑概率意义下的平均误差。
由于,平均误差(平方)= 即等于估计量的方差;因为最小二乘法估计是无偏估计,均值即为参数真值,所以估计量关于均值的平均偏差--方差也就反映了估计量与参数真值的平均偏差。
在前面的证明过程中已经得到: 假定由于正态分布的线性组合仍是正态分布,而且分布形式由其均值和方差惟一确定,所以:这样,参数估计量的平均误差为: 其中,涉及到随机误差项的方差,这个值通常不知道,实际计算中一般采用的无偏估计量: 来估计,并且用符合来表示系数的估计误差为:同理的估计误差为:又称为系数的标准误差(或标准差)。
Eviews软件在估计回归模型时,将同时输出系数的估计值和标准差。
需要指出的是,系数的标准差只是反映了估计量和真值的相对偏离程度;越小,则与的近似误差越小,但不能认为与之间的绝对误差就是。
系数的置信区间统计量: 所以对于给定的置信度,由t分布表可以查得临界值,使得:,即:所以系数b的置信区间为: 即以的概率保证回归系数属于该区间的。
显然,置信区间越小,对回归系数的估计精度就越高。
从置信区间的计算公式可以看出,置信区间的长度为,在a取定的情况下,是一个常数,所以置信区间的长度主要取决于系数的标准差,越小,则估计的误差越小,估计值与真值越接近。
因此,称为系数的估计误差,并用它来衡量估计的精度是合理的;而且,在一定的概率下,与的绝对误差充其量不会超过。
5.极大似然估计的原理:既然所抽取的样本是在一次观测中得到的,表明“观察值落在该样本周围”是一个比较容易发生的大概率事件,因此,所选择的参数估计值应该使这一事件的概率达到最大。
最小二乘估计是使模型对样本的拟合达到最优,而极大似然估计却是使样本出现的概率达到最大。
回归模型的统计检验:1. 模型的拟合优度检验所谓“拟合优度”,即模型对样本数据的近似程度。