非线性回归模型的线性化
k 1 beatut yt
k 1 beatut yt
ln
k yt
1
ln b at
ut
令yt
ln
k yt
1
,
b
ln b
yt b at ut
此时可用最小二乘法估计b*和a。
钉螺存活率曲线 (生长曲线模型)
把一批钉螺埋入土中,以后每隔一个月取出部分钉螺,检 测存活个数,计算存活率。数据见表。
FOOD
3000
2000
1000
0 0
4000
8000
12000
INCOME 16000 20000
9.0 LOG(FOOD)
8.5
8.0
7.5
7.0
6.5
6.0 LOG(LOG(INCOME))
5.5 1.80 1.85 1.90 1.95 2.00 2.05 2.10 2.15 2.20 2.25 2.30
以1为例
1
yt xt1
线性模型中的回归系数(边际系数)是对数线性回归模型中弹性
系数的一个分量。
应用柯布-道格拉斯生产函数模型评价台湾省农业生产 效率。利用台湾省1958-1972年农业生产总值yt、劳动力 投入xt1、资本投入xt2的数据估计模型如下:
Yˆt
0.035X
1.5 t1
X
0.49 t2
yt ke be at
yt ke be at
曲线的上限和下限分别为k和0 。
当a 0, Limyt k, 当a 0,b 0 , Limyt 0
t
t
曲线有拐点,坐标为 Lnb , k
a e
, 但曲线不对称于拐点。
一般情形,上限值k可事先估计,有了k值,龚伯斯曲线才 可以用最小二乘法估计参数。
是无法用最小二乘法估计参数的。可采用非线性方 法进行估计。
(1) 幂函数模型(全对数模型)
(b > 1)
(b = -1) (b < -1)
(0<b <1)
(0 > b > -1)
yt axtbeut
b取不同值的图形分别见上图。对上式等号两侧同取对数,得
Lnyt = Lna + b Lnxt + ut 令yt* = Lnyt, a* = Lna, xt* = Lnxt, 则上式表示为
非线性回归模型的线性化
有时候变量之间的关系是非线性的。虽然其形式 是非线性的,但可以通过适当的变换,转化为线性模 型,然后利用线性回归模型的估计与检验方法进行处 理。称此类模型为可线性化的非线性模型。
对于那些不可线性化的非线性回归模型,例如
Yt 0 1 Xt 1 ut Yt 0e1Xt ut
厦门市贷款总额loan与GDP的关系分析(单位:亿元)
从散点图看,用多项式方程拟合比较合理。
Loant = 0 +1 GDPt + 2 GDPt 2 + 3 GDPt3 + ut
(6) 生长曲线 (logistic) 模型
a>0
a<0
一般f(t) = a0 + a1 t + a2 t 2 + … + an t n,常见形式为f(t) = a0 - a t
T 15
(5)多项式函数模型(1)
一种多项式方程的表达形式是
yt = b0 +b1 xt + b2 xt2 + b3 xt3 + ut 令xt 1 = xt,xt 2 = xt2,xt 3 = xt3,上式变为
yt = b0 +b1 xt 1 + b2 xt 2 + b3 xt 3 + ut 这是一个三元线性回归模型。如经济学中的总成本与产 品产量曲线与左图相似。
yt ke be at
线性化过程如下:当k给定时,
yt e be at k
k ebe at yt
ln
k yt
be
at
ln ln
k yt
ln
b
at
令y
ln ln
k yt
, b
ln
b
y b at
上式可用最小二乘法估计b* 和 a。
案例:硫酸透明度与铁杂质含量的关系
某硫酸厂生产的硫酸的透明度一直达不到优质指标。 经分析透明度低与硫酸中金属杂质的含量太高有关。 影响透明度的主要金属杂质是铁、钙、铅、镁等。 通过正交试验的方法发现铁是影响硫酸透明度的最 主要原因。测量了47个样本,得硫酸透明度(y)与 铁杂质含量(x)的散点图如下:
d ln(ln xt )
1 ln xt
1 xt
dxt
6.2072 dyt yt ln xt dxt xt
6.2072 dyt yt ln xt dxt xt
弹性函数 6.2072 ln xt 。说明人均食品支出对人均收入 的弹性系数是随着城镇人均收入的增加而减少的。 当城镇人均收入1000元水平时,人均收入增加1%, 人均食品支出增加0.8986%;当城镇人均收入16000 元水平时,人均食品支出对人均收入的弹性系数下降 到0.6412%。城镇人均食品支出对人均收入的弹性系数 随着人均收入的提高而递减。
yt存活率(%)
100.0 93.0 92.3 88.0 84. 82.0 48.4 41.0 15.0 5.2 3.5 1.3 0.5
t土埋月数
0 1 2 3 4 5 6 7 8 9 10 11 12
100
Y 80
60
40
20
T
0
0
2
4
6
8
10
12
设定yt的上渐近极限值k =101(因 为已有观测值yt =100,所以令k =101更好些。),得估计结果如下:
yˆ t
101 1 0.0134e0.76536.5
34.3
(00)
钉螺存活率样本值与拟合值。
100 Y YF
80
60
40
20
T
0
2
4
6
8
10
12
⑺ 龚伯斯(Gompertz)曲线
英国统计学家和数学家最 初提出把该曲线作为控制 人口增长的一种数学模型, 此模型可用来描述一项新 技术,一种新产品的发展 过程。
yt* = a* + b xt* + ut 变量yt* 和xt* 之间已成线性关系。幂函数模型也称作全对数模型。
全对数模型的特点是模型弹性系数b为常数。
yt axt eb ut
Lnyt = Lna + b Lnxt + ut
b d ln yt dyt yt d ln xt dxt xt
回归系数b是被解释变量 yt 与解释变量 xt 的变 化率的比,所以称b为弹性系数。b用来测量当 xt 变化1%时,yt 变化百分之多少。
(4) 双曲线函数模型
1/yt = a + b/xt + ut b>0
yt = a + b/xt + ut b>0
1/yt = a + b/xt + ut 令yt* = 1/yt , xt* = 1/xt,得 yt* = a + b xt* + ut 已变换为线性回归模型。双曲线函数还有另一种表达方式,
yt
1
k e f (t
)ut
1
k ea0 at ut
yt
1
k e a 0 at
ut
1
k beat
ut
b ea0
美国人口统计学家Pearl和Reed广泛研究了有机体的生长,得到 了上述数学模型。生长模型(或逻辑斯谛曲线,Pearl-Reed曲线) 常用于描述有机体生长发育过程。其中k和0分别为yt的上限和 下限。
28个省市自治区19852005年城镇居民人均食品支出(food)与 人均收入(income)的关系
用数据估计模型,得回归结果如下:
ln yˆt 5.8117 6.2072ln(ln xt ) (61.7) (137.3)
R2 0.97 , T 588
由上式,导函数是
6.2072 d ln yt dyt yt
因为1.5 0.49 1.99,所以,
此生产函数属规模报酬
递增函数。当劳动力和
资本投入都增加1%时,
产出增加近2%。
(2) 指数函数模型(半对数模型)
60 50 40 30 20 10
0 -10
50 100 150 200 250 300 350 400
1.2 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4
以a 0为例, Limyt k,
t
Limyt 0
t
曲线有拐点,曲线的上下两部分对称于拐点
ln b , k a 2
。
为能运用最小二乘法估计参数a, b,必须事先估计出生长曲 线上极限值k(根据所研究的问题,k值是可以事先给定的)。 线性化过程如下。当k给出时,作如下变换,
k yt 1 beatut
Lnyt = Lna + b t + ut
b d ln yt dyt yt yt1 yt
dt
dt
yt
回归系数 b 是近似等于单位时间内的增长率。
Lnyt = Lna + b t + ut称为增长模型。
中国税收增长的定量分析 1990-2006年中国税收(Tax,亿元)数据见中国税收 增长的定量分析.wf1
半对数模型的弹性系数和边际系数都不是常数。
yt aebxt ut Lnyt = Lna + b xt + ut
b d ln yt dyt yt