第四节 非线形回归模型
一、 可线性化模型
在非线性回归模型中,有一些模型经过适当的变量变换或函数变换就可以转化成线性回归模型,从而将非线性回归模型的参数估计问题转化成线性回归模型的参数估计,称这类模型为可线性化模型。
在计量经济分析中经常使用的可线性化模型有对数线性模型、半对数线性模型、倒数线性模型、多项式线性模型、成长曲线模型等。
1.倒数模型
我们把形如:
u x
b b y ++=110;u x b b y ++=1110 (3.4.1) 的模型称为倒数(又称为双曲线函数)模型。
设:x
x 1*=,y y 1*=,即进行变量的倒数变换,就可以将其转化成线性回归模型。
倒数变换模型有一个明显的特征:随着x 的无限扩大,y 将趋于极限值0b (或0/1b ),即有一个渐进下限或上限。
有些经济现象(如平均固定成本曲线、商品的成长曲线、恩格尔曲线、菲利普斯曲线等)恰好有类似的变动规律,因此可以由倒数变换模型进行描述。
2.对数模型
模型形式:
u x b b y ++=ln ln 10 (3.4.2)
(该模型是将u
b e Ax y 1=两边取对数,做恒等变换的另一种形式,其中A b ln 0=)。
上式lny 对参数0b 和1b 是线性的,而且变量的对数形式也是线性的。
因此,我们将以上模型称为双对数(double-log)模型或称为对数一线性(log-liner)模型。
令:x x y y ln ,ln **==代入模型将其转化为线性回归模型: u x b b y ++=*10* (3.4.3)
变换后的模型不仅参数是线性的,而且通过变换后的变量间也是线性的。
模型特点:斜率1b 度量了y 关于x 的弹性:
x
dx y dy x d y d b //)(ln )(ln 1== (3.4.4) 它表示x 变动1%,y 变动了多少,即变动了1b %。
模型适用对象:对观测值取对数,将取对数后的观测值(lnx ,lny )描成散点图,如果近似为一条直线,则适合于对数线性模型来描述x 与y 的变量关系。
容易推广到模型中存在多个解释变量的情形。
例如,柯布——道格拉斯生产函数形式:
u e K AL Q βα=
式中:Q ——产出量,K ——资本投入量,L ——劳动投入量,A ,βα,为未知参数。
对于这样的非线性模型,可以通过对数变换,使之线性化。
对上式两边取对数得到如下模型:
u K L A Q +++=ln ln ln ln βα
再令:L L Q Q ln ,ln **==,K K A A ln ,ln *
*==,得到线性模型: u K L A Q +++=βα**
模型中的α、β分别为劳动、资本的产出弹性:
L dL Q dQ L d Q d //)(ln )(ln ==
α;K
dK Q dQ K d Q d //)(ln )(ln ==β 3.半对数模型 在对经济变量的变动规律研究中,测定其增长率或衰减率是一个重要方面。
在回归分析中,我们可以用半对数模型来测度这些增长率。
模型形式:
u x b b y ++=ln 10 (对数--线性模型) (3.4.5)
u x b b y ++=10ln (线性--对数模型) (3.4.6)
模型特点:半对数模型中的回归系数也有很直观的含义:对数--线性模型中,
x
dx dy x d dy b /)(ln 1== (3.4.7) 表示x 每变动1%时,y 将变动的绝对量,即变动b%个单位。
线性——对数模型中,
dx
y dy dx y d b /)(ln 1== (3.4.8) 它表示x 每变动1个单位时,y 将变动的百分比,即变动100b %。
特别地,若x 为时间变量(年份),则系数1b 衡量了y 的年均增长速度。
正因为如此,所以半对数模型又称为增长模型。
模型适用范围:当x 变动一个相对量时,y 以一个固定的绝对量随之变动,可用(3.4.7)式来描述;当x 变动一个绝对量时,y 以一个固定的相对量随之变动,适宜用(3.4.8)式来描述。
例如,我们可以通过估计下面的半对数模型:
t t u t b b GDP ++=10)ln(
得到我国GDP 的年增长率的估计值,这里t 为时间趋势变量。
4.多项式模型
多项式回归模型在生产与成本函数这个领域中被广泛地使用。
多项式回归模型可表示为
u x b x b x b b y k k +++++= 2210 (3.4.9)
设:),2,1(k t x x t t ==,则
u x b x b x b b y k k +++++= 22110 (3.4.10)
模型转化成多元线性回归模型
例:为了分析某行业的生产成本情况,从该行业中选取了10家企业,下表中列出了这些企业总产量y(吨)和总成本x (万元)的有关资料,试建立该行业的总成本函数和边际成本函数。
某行业产量与总成本统计资料 总成本y 总产量x
19.3
10 22.6
20 24.0
30 24.4
40 25.7
50 26.0 60
27.4 70
29.7 80
35.0 90
42.0 100
根据边际成本的U 型曲线理论,总成本函数可以用产量的三次多项式近似表示,即
u x b x b x b b y ++++=332210
设:)3,2,1(==t x x t t ,则将其转化为三元线性回归模型。
在EViews 软件的命令窗口,
依次键入:
GENR X1=X
GENR 22∧=X X
GENR 33∧=X X
LS Y C X1 X2 X3
回归结果如下:
回归结果
得到总成本函数的估计式为
32000094.0012962.0634777.017667.14ˆx x x y
+-+= s = (0.637532) (0.047786) (0.000986) (0.00000591)
t = (22.23678) (13.28372) (-13.15005) (15.89677)
998339.02=R 997509.02=R 328491.0.=E S 00212.2=DW 220
.1202=F
对总成本函数求导数,得到边际成本函数的估计式为
2000272.0025934.0634777.0ˆx x dx
y d +-= 因此,当产量低于0.025934/(2⨯0.000272)=47.673(吨)时,边际成本是递减的;而产量超过这个水平时,边际成本又呈上升趋势。
二、 非线性化模型的处理方法
无论通过什么变换都不可能实现线性化,这样的模型称为非线性化模型。
对于非线性化模型,一般采用高斯——牛顿迭代法进行估计,即将其展开成泰勒级数之后,再利用迭代估计方法进行估计。
三、 回归模型的比较
当经济变量之间呈现非线性关系时,如何选择一个比较合适的模型,比较模型的优劣?这就是回归模型的比较问题。
1.图形观察分析
(1)观察被解释变量和解释变量的趋势图。
(2)观察被解释变量与解释变量的相关图。
2.模型估计结果观察分析
对于每个模型的估计结果,可以依次观察以下内容:
(1)回归系数的符号和值的大小是否符合经济意义,这是对所估计模型的最基本要求。
(2)改变模型形式之后是否使判定系数的值明显提高。
(3)各个解释变量t 检验的显著性。
(4)系数的估计误差较小。
3.残差分布观察分析
模型的残差反映了模型未能解释部分的变化情况,可以观察分析以下内容:
(1)残差分布表中,各期残差是否大都落在±σ
ˆ的虚线框内,这直观地反映了模型拟合误差的大小及变化情况。
(2)残差分布是否具有某种规律性,即是否存在着系统误差(模型形式有误或漏掉了重要的解释变量)
(3)近期残差的分布情况:近期误差越小越好。
4.利用判定系数比较模型的拟合优度时,如果两个模型包含的解释变量个数不同,则应采用“调整的判定系数”。
5.人们还使用另外两个指标SC (Schwarz Criterion ,施瓦兹准则)和AIC(Akaike lnformation Criterion ,赤池信息准则)来比较含有不同解释变量个数模型的拟合优度。
)ln(1]ln[2n n
k n e SC t ++∑= (3.4.11) n
k n e AIC t )1(2]ln[2++∑= (3.4.12) 显然,其值越小,表明模型的的拟合优度越高。
感谢您的支持与配合,我们会努力把内容做得更好!。