非线性回归模型的线性化以上介绍了线性回归模型。
但有时候变量之间的关系是非线性的。
例如 y t = α 0 + α11βt x + u t y t = α 0 t x e 1α+ u t上述非线性回归模型是无法用最小二乘法估计参数的。
可采用非线性方法进行估计。
估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现。
计算机的出现大大方便了非线性回归模型的估计。
专用软件使这种计算变得非常容易。
但本章不是介绍这类模型的估计。
另外还有一类非线性回归模型。
其形式是非线性的,但可以通过适当的变换,转化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。
称此类模型为可线性化的非线性模型。
下面介绍几种典型的可以做线性化处理的非线性模型。
⑴ 指数函数模型y t = t t u bx ae + (4.1) b >0 和b <0两种情形的图形分别见图4.1和4.2。
显然x t 和y t 的关系是非线性的。
对上式等号两侧同取自然对数,得Lny t = Lna + b x t + u t (4.2)令Lny t = y t *, Lna = a *, 则y t * = a * + bx t + u t (4.3) 变量y t * 和x t 已变换成为线性关系。
其中u t 表示随机误差项。
图4.1 y t =tt u bx ae+, (b > 0) 图4.2 y t =tt u bx ae +, (b < 0)⑵ 对数函数模型y t = a + b Ln x t + u t (4.4)b >0和b <0两种情形的图形分别见图4.3和4.4。
x t 和y t 的关系是非线性的。
令x t * = Lnx t , 则y t = a + b x t * + u t (4.5)变量y t 和x t * 已变换成为线性关系。
图4.3 y t = a + b Lnx t + u t , (b > 0) 图4.4 y t = a + b Lnx t + u t , (b < 0)⑶幂函数模型y t= a x t b t u e(4.6)b取不同值的图形分别见图4.5和4.6。
x t和y t的关系是非线性的。
对上式等号两侧同取对数,得Lny t = Lna + b Lnx t + u t(4.7) 令y t* = Lny t, a* = Lna, x t* = Lnx t, 则上式表示为y t* = a* + b x t* + u t(4.8) 变量y t* 和x t* 之间已成线性关系。
其中u t表示随机误差项。
(4.7) 式也称作全对数模型。
图4.5 y t = a x t b t u e图4.6 y t = a x t b t u e⑷双曲线函数模型1/y t = a + b/x t+ u t(4.9)也可写成,y t = 1/ (a + b/x t+ u t) (4.10) b>0情形的图形见图4.7。
x t和y t的关系是非线性的。
令y t* = 1/y t, x t* = 1/x t,得y t* = a + b x t* + u t已变换为线性回归模型。
其中u t表示随机误差项。
图4.7 y t = 1/ (a + b/x t ), (b > 0) 图4.8 y t = a + b/x t , (b > 0) 双曲线函数还有另一种表达方式,y t = a + b/x t + u t(4.11) b>0情形的图形见图4.8。
x t和y t的关系是非线性的。
令x t* = 1/x t,得y t = a + b x t* + u t上式已变换成线性回归模型。
⑸多项式方程模型一种多项式方程的表达形式是y t = b0 +b1 x t + b2 x t2 + b3 x t3 + u t(4.12)其中b1>0, b2>0, b3>0和b1<0, b2>0, b3<0情形的图形分别见图4.9和4.10。
令x t 1 = x t,x t 2 = x t2,x t 3 = x t3,上式变为y t = b0 +b1 x t 1 + b2 x t 2 + b3 x t 3 + u t(4.13)这是一个三元线性回归模型。
如经济学中的总成本曲线与图4.9相似。
图4.9 y t = b0 +b1 x t + b2 x t2 + b3 x t3 + u t图4.10 y t = b0 + b1 x t + b2 x t2 + b3 x t3 + u t 另一种多项式方程的表达形式是y t = b0 + b1 x t + b2 x t2 + u t(4.14)其中b1>0, b2>0和b1<0, b2<0情形的图形分别见图4.11和4.12。
令x t 1 = x t,x t 2 = x t 2,上式线性化为,y t = b0 + b1 x t1 + b2 x t2 + u t(4.15)如经济学中的边际成本曲线、平均成本曲线与图4.11相似。
图4.11 y t = b 0 +b 1x t + b 2x t 2 + u t 图4.12 y t = b 0 + b 1x t + b 2x t 2 + u t⑹ 生长曲线 (logistic) 模型y t = tu t f e k++)(1 (4.16)一般f (t ) = a 0 + a 1 t + a 2 t 2 + … + a n t n ,常见形式为f (t ) = a 0 - a ty t = u u at a e k +-+)(01= tu at be k+-+1 (4.17) 其中b = 0a e 。
a > 0情形的图形分别见图4.13和4.14。
美国人口统计学家Pearl 和Reed 广泛研究了有机体的生长,得到了上述数学模型。
生长模型(或逻辑斯谛曲线,Pearl-Reed 曲线)常用于描述有机体生长发育过程。
其中k 和0分别为y t 的生长上限和下限。
∞→t t Limy = k ,-∞→t t Limy = 0。
a , b 为待估参数。
曲线有拐点,坐标为(a Lnb ,2k),曲线的上下两部分对称于拐点。
图4.13 y t = k / (1 +tu at be+-) 图4.14 y t = k / (1 +tu at be +)为能运用最小二乘法估计参数a , b ,必须事先估计出生长上极限值k 。
线性化过程如下。
当k 给出时,作如下变换,k /y t = 1 + t u at be +- 移项, k /y t - 1 = t u at be +-取自然对数,Ln ( k /y t - 1) = Lnb - a t + u t (4.18) 令y t * = Ln ( k /y t - 1), b * = Lnb , 则y t * = b * - a t + u t (4.19)此时可用最小二乘法估计b *和a 。
图4.15 内地5月1日至28日每天非典数据一览⑺ 龚伯斯(Gompertz )曲线英国统计学家和数学家最初提出把该曲线作为控制人口增长的一种数学模型,此模型可用来描述一项新技术,一种新产品的发展过程。
曲线的数学形式是,y t =at be ke --图4.15 y t =atbeke --曲线的上限和下限分别为k 和0,∞→t t Limy = k , -∞→t t Limy = 0。
a , b 为待估参数。
曲线有拐点,坐标为(a Lnb ,ek ),但曲线不对称于拐点。
一般情形,上限值k 可事先估计,有了k 值,龚伯斯曲线才可以用最小二乘法估计参数。
线性化过程如下:当k 给定时,y t / k = at be e --,k /y t = at be e -Ln (k /y t ) = at be -, Ln [Ln (k /y t )] = Lnb - a t令y *= Ln [Ln (k /y t )], b * = Lnb ,则y * = b * - a t上式可用最小二乘法估计b * 和 a 。
Cobb-Douglas 生产函数下面介绍柯布−道格拉斯(Cobb-Douglas )生产函数。
其形式是Q = k L α C 1- α (4.24)其中Q 表示产量;L 表示劳动力投入量;C 表示资本投入量;k 是常数;0 < α < 1。
这种生产函数是美国经济学家柯布和道格拉斯根据1899-1922年美国关于生产方面的数据研究得出的。
α的估计值是0.75,β的估计值是0.25。
更习惯的表达形式是y t =t u t t e x x 21210βββ (4.25)这是一个非线性模型,无法用OLS 法直接估计,但可先作线性化处理。
上式两边同取对数,得:Lny t = Ln β0 + β1 Lnx t 1 + β2 Lnx t 2 + u t (4.26)取 y t * = Lny t , β0* = Ln β0, x t 1* = Ln x t 1, x t 2* = Ln x t 2,有y t *= β0* +β1 x t 1* + β2 x t 2* + u t (4.27)上式为线性模型。
用OLS 法估计后,再返回到原模型。
若回归参数 β1 + β2 = 1,称模型为规模报酬不变型(新古典增长理论); β1 + β2 > 1,称模型为规模报酬递增型; β1 + β2 < 1,称模型为规模报酬递减型。
对于对数线性模型,Lny = Ln β0 + β1 Lnx t 1 + β2 Lnx t 2 + u t ,β1和β2称作弹性系数。
以β1为例,β1 = 1t t Lnx Lny ∂∂= 1111t t t t x x y y ∂∂--= 11//t t tt x x y y ∂∂= 11t t t t x y y x ∂∂ (4.28) 可见弹性系数是两个变量的变化率的比。
注意,弹性系数是一个无量纲参数,所以便于在不同变量之间比较相应弹性系数的大小。
对于线性模型,y t = α0 + α1 x t 1 + α2 x t 2 + u t ,α1和 α2称作边际系数。
以α1为例,α1 =1t tx y ∂∂ (4.29) 通过比较(4.28)和(4.29)式,可知线性模型中的回归系数(边际系数)是对数线性回归模型中弹性系数的一个分量。
例1:此模型用来评价台湾农业生产效率。
用台湾1958-1972年农业生产总值(y t ),劳动力(x t 1),资本投入(x t 2)数据(见表4.1)为样本得估计模型, ∧t Lny = -3.4 + 1.50 Lnx t 1 + 0.49 Lnx t 2 (4.30) (2.78) (4.80) R 2 = 0.89, F = 48.45 还原后得,t yˆ= 0.713 x t 11.50 x t 20.49 (4.31) 因为1.50 + 0.49 = 1.99,所以,此生产函数属规模报酬递增函数。