当前位置:文档之家› 生产函数估计与预测方法介绍

生产函数估计与预测方法介绍

生产函数估计与预测方法介绍一、生产函数的估计1.含义我们在《经济学》课程的学习中已经知道,产量是由生产要素的投入数量和组合关系决定的。

那么生产函数的估计实际就是客观反映生产量与各生产要素投入量之间的函数关系。

2.方法与步骤估计生产函数最常用的方法是利用实际收集到的一组数据进行回归分析,这种方法较为客观,通过它得到的信息比较完全和精确。

为了完成回归分析,我们必须首先构造一个生产函数并确定函数的具体形式;然后再在收集数据的基础上用回归分析方法求出函数的具体参数值;最后,我们还需要检验回归结果对数据的拟合程度,以及回归分析的前提条件是否成立,因为一个没有显著函数关系或回归分析前提条件不成立的回归分析结果是没有意义的。

(1)影响变量的选取就一个具体的回归分析而言,各个变量必须具有特定的含义。

在进行回归分析时,我们应该对于研究对象具有深入的了解,否则在函数构造这一步可能会漏掉一些很重要的解释变量。

在进行回归分析时应注意不要漏掉重要的解释变量,但这并不意味着解释变量越多越好,因为在模型中包括一些并不重要的解释变量反而会引起一些统计上的问题,一般来说,当解释变量超过5至6个时,就可能降低模型的自由度,甚至引起多重共线性问题,这些都会影响到模型的解释力。

对于一些属性因素,如年龄、季节、性别等,如不同的属性表现对被解释变量有明显不同的影响时,还需设计虚拟变量。

(2)生产函数形式的确定上面所构造的生产函数只涉及了变量的选取,但为了完成回归分析,我们必须确定生产函数的具体形式。

生产函数可采用多元线性的,但一般最常用的是柯布—道格拉斯生产函数2211b b X AX Y =(3)数据的收集当模型的具体形式已经确定下来之后,我们需要针对模型中的变量收集样本数据。

数据类型包括时序数据和截面数据。

回归分析中也会碰到数据不足的情况,这时我们就不得不做一些理论上简化,(4)建立回归方程及参数估计1)一元线性回归模型①总体回归模型如果两个变量在总体上存在线性回归关系,可以用下式表示 ε++=bx a Y —随机误差公式中a,b 是总体回归模型的参数,ε是X 变量以外其它所有影响因素对Y 值的总合影响,故称随机干扰项。

如果在一定时期内一些因素的单独影响都比较零散、微弱,就可以不把它们单独列为自变量,而合并为一个随机因素。

在一个模式中是否存在随机误差,体现了确定型依存关系和统计型依存关系的区别。

随机误差体现了在X 取既定值时Y 的变异。

②假定前提a. ε是随机变量对应于某个X 既定值,ε的符号和绝对值的大小是随机的,它既独立于X 的取值,也独立于前一项ε值。

b.ε服从正态分布影响Y 的其它因素的作用趋于互相抵消,E (ε)=0,Y 的期望值落在总体回归线上,在给定X 值后,Y 值围绕Y 的期望值呈正态分布。

c.对于任何X 值,ε有恒定的方差2,x y σ(同方差性)。

无论X 取什么值,Y 值围绕总体回归线的变异程度相同。

③总体回归直线方程与样本回归直线方程如果从总体回归函数,εβα++=x Y 中排除ε,就得到表示Y 值随X 取值而定的正态分布期望值与X 值关系的方程—总体回归直线方程bx a x y +=,μ上式表明,在X 的值给定的条件下,Y 的期望值是X 的严密的线性函数。

x y ,μ称为Y 的条件平均数,对于一个双变量协变总体,当自变量X 取特定值时,因变量取值服从如下 正态分布),(~2,,x y x y N Y σμ根据样本数据拟合的直线,称为样本回归直线。

tt x b a y ˆˆˆ+=,t=1,2,…… 式中Y 是样本回归线上与X 相对应的Y 值,可视为x y ,μ的估计,称为Y 的估计值或拟合值,aˆ为截距,b ˆ为斜率,表示当X 变化1个单位时Y 的变化量,它们是总体回归系数a,b 的估计值。

实际观测到的变量Y 值,并不完全等于yˆ,如果用e 表示两者之差,它与总体误差项ε相对应t t t yY e ˆ-= e 称为残差 由上述可知,样本回归直线是对总体回归直线的近似反映。

回归分析的主要任务就是采用适当的方法,充分利用样本所提供的信息,使得样本回归直线尽可能地接近真实的总体回归直线。

④回归模型参数的估计a.回归系统的估计根据样本资料确定样本回归方程时,一般总希望Y 的估计值从整体来看尽可能接近实际观测值。

即残差t e 的总量越小越好,为了避免t e 简单的代数和会相互抵消,也便于数学上的处理,通常采用残差平方和2t e ∑作为衡量偏差的尺度。

最小二乘法就是根据这一思路,通过使残差平和和为最小来估计回归系数的一种方法。

222)ˆˆ()ˆ(tt t t t x b a Y y Y e Q --∑=-∑=∑= 很明显,残差平方和Q 的大小将依赖于aˆ和b ˆ的取值。

根据微积分求极小值的原理,Q 对aˆ和b ˆ的偏导必须为零。

⎪⎩⎪⎨⎧∑=∑+∑∑=∑+t t t t t t Y X X b X aY X b a n 2ˆˆˆˆ 2)())((x x x x x x b i i i -∑--∑=⇒ 或 22)(ˆt t t t t t x x n Y X Y X n b ∑-∑∑∑-∑= X b Y a -= nX b Y a t t ∑-∑=ˆ aˆ,b ˆ的具体数值即回归系数的估计值随选取的样本不同而不同,所以它是随机变量。

b.总体方差的估计除了a ,b 之外 ,一元线性回归模型还包括了另一个未知参数,总体方差2,x y σ,它可以反映理论模型误差的大小。

在数学上,2,x y σ的无偏估计是2,x y S 。

2)(222,--∑=-∑=∧n y Y n e S x y n 为样本容量,x y S ,称为估计标准误差。

它可用于描述用样本数据拟合回归直线时,在X 取特定值时Y 观察值对于相应的拟合值的离散程序。

c.最小二乘估计量的性质最小二乘法是估计方法中的一种,最小二乘估计量是总体回归系数的无偏估计量,数学上还可进一步证明,在所有的无偏估计量中回归系数的最小二乘估计量的方差最小;同时随着样本容量的增大,其方差会不断缩小,所以它又是最优和一致估计量。

2)多元线性回归模型现实中,某一现象的变动常受多种现象变动的影响,右这种场合,仅仅考虑单个变量是不够的,这就产生了测定多因素之间相关关系的问题。

研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,它是一元线性回归模型的扩展,其基本原理与一元线性回归模型相类似,只是在计算上比较繁琐。

①总体回归函数与总体回归直线t kt k t t t x x x εβββα+++++=Y Λ2211kt k t x y x x ββαμ+++=Λ11.α表示截距,j β表示在其它自变量保持不变的情况下,自变量j x 变动一个单位所引起的因变量Y 平均变动的数额,成为偏回归系数。

②前提假定与一元线性前提假定相同,另外再加上,回归模型所包含的自变量之间不能具有较强的线性关系。

③样本回归方程kt k t t x x Y ∧++=ββαΛ11ˆˆˆ (t=1,2,……n) ④模型的估计以三元线性回归方程为例,即t t t x x Y 2211ββα++=a.回归系数的估计(最小二乘法)2221122)ˆˆ()ˆ(tt t t t t x x Y Y Y e MinQ ββ--∑=-∑=∑= ⎪⎩⎪⎨⎧∑+∑+∑=∑∑+∑+∑=∑∑+∑+=∑22211222122111122112ˆˆˆˆˆˆˆˆˆx x x x Y X x x x x Y X x x n Y ββαββαββα b.总方差的估计kn e S t y -∑=2212.n :样本容量,k :方程中回归系数的个数22,n y S 称为回归估计的标准误差,越小表明样本回归方程的代表性越强3ˆˆˆ22112,-∑-∑-∑-∑=n Y x Y x Y Y S x y ββα 3)非线性回归模型如果因变量和自变量之间是非线性关系,我们就必须采用非线性回归模型,但对非线性回归模型的估计必须首先将其转化为线性函数,然后再利用先行回归方法估计各参数。

非线性回归模型主要有以下几种:①幂函数2211b b x ax Y = 两边取对数,得:2211ln ln ln ln x b x b a Y ++=令:Y Y ln =' a A ln = 11ln x x =', 22ln x x =' 221x b x b A Y '+'+=' 这种形式就是前面的三元线性回归方程。

利用前文所述方法估计模型参数。

特点:方程中的参数可以直接反映因变量Y 对于某一个自变量的弹性。

Y x ax b Y X x ax b YX X Y Z b b b b x y /)(/)(2121112111211111=⋅⋅=⋅∂∂=-=1b 即,b 1是在其它因素不变的条件下,x 1变动1%所引起Y 变动的百分比。

②指数型:2121x x b ab Y = 两边取对数,得:2211ln ln ln ln b x b x a Y ++=令Y Y ln =' a A ln = 11ln b B = 22ln b B =,则2211x B x B A Y ++='③多项式函数32dx cx bx a Y +++=令:x x =1 22x x = 33x x =321dx cx bx a Y +++=非线性回归方程转化为线性回归方程后,可利用前文所述方法,估计各参数,最后利用反函数转化为最初形式。

(5)回归模型的检验1)经济学检验经济学检验主要是检验参数估计值的符号和取值区间所显示的自变是与应变量的变化关系是否与理论和人们的实践经验相一致。

2)统计学检验利用统计学中的抽样理论来检验样本回归方程的可靠性。

a.拟合程度的评价所谓拟合程度,是指样本观测值聚在样本回归线周围的紧密程度,判断回归模型拟合程序优劣最常用的数量指标是可决系数,该指标是建立在对总离差平方和进行分解的基础上。

tt t t t t e Y Y Y Y Y Y Y Y +-=-+-=-)ˆ()ˆ()ˆ()( 总离差=可解释离差+未解释离差两边取平方,得)ˆ)(ˆ(2)ˆ()(22tt t t t Y Y Y Y e Y Y Y Y --∑+∑+-∑=-∑ 22)ˆ()ˆ(tt Y Y Y Y -∑+-∑= SSE SSR SST +=离差平方和=回归平方和+残差平方和显而易见,如果各个样本观察点与样本回归直线靠得越紧,SSR 在SST 中所占比重超越大,因此可定义这一比例为可决系数。

222)()ˆ(11Y Y Y Y SST SSE SST SSR r t t t -∑-∑-=-== 102≤≤r 可决系数越大,方程拟合度越高,在多元线形回归方程中,为了更准确地衡量回归方程的拟合程度,常使用经调整的多元可决系数。

相关主题