当前位置:文档之家› 非线性回归预测法——高斯牛顿法(詹学朋)

非线性回归预测法——高斯牛顿法(詹学朋)

非线性回归预测法前面所研究的回归模型,我们假定自变量与因变量之间的关系是线性的,但社会经济现象是极其复杂的,有时各因素之间的关系不一定是线性的,而可能存在某种非线性关系,这时,就必须建立非线性回归模型。

一、非线性回归模型的概念及其分类非线性回归模型,是指用于经济预测的模型是曲线型的。

常见的非线性回归模型有下列几种: (1)双曲线模型:i ii x y εββ++=121 (3-59) (2)二次曲线模型:i i i i x x y εβββ+++=2321 (3-60)(3)对数模型:i i i x y εββ++=ln 21 (3-61)(4)三角函数模型:i i i x y εββ++=sin 21 (3-62)(5)指数模型:i x i i ab y ε+= (3-63)i i i x x i e y εβββ+++=221110 (3-64)(6)幂函数模型:i b i i ax y ε+= (3-65)(7)罗吉斯曲线:i x x i iie e y εββββ++=++1101101 (3-66)(8)修正指数增长曲线:i x i i br a y ε++= (3-67)根据非线性回归模型线性化的不同性质,上述模型一般可细分成三种类型。

第一类:直接换元型。

这类非线性回归模型通过简单的变量换元可直接化为线性回归模型,如:(3-59)、(3-60)、(3-61)、(3-62)式。

由于这类模型的因变量没有变形,所以可以直接采用最小平方法估计回归系数并进行检验和预测。

第二类:间接代换型。

这类非线性回归模型经常通过对数变形的代换间接地化为线性回归模型,如:(3-63)、(3-64)、(3-65)式。

由于这类模型在对数变形代换过程中改变了因变量的形态,使得变形后模型的最小平方估计失去了原模型的残差平方和为最小的意义,从而估计不到原模型的最佳回归系数,造成回归模型与原数列之间的较大偏差。

第三类:非线性型。

这类非线性回归模型属于不可线性化的非线性回归模型,如:(3-66)和(3-67)式。

第一类和第二类非线性回归模型相对于第三类,又称为可线性化的非线性回归模型。

本节重点研究第一类和第二类即可线性化的非线性回归模型。

二、可线性化的非线性回归模型的模型变换及参数估计 1.直接换元法换元过程和参数估计方法,如表3-6所示。

例设某商店1991~2000年的商品流通费用率和商品零售额资料如下表:表3-7 直接换元法计算表根据上述资料,配合适当的回归模型分析商品零售额与流通费用率的关系,若2001年该商店商品零售额将为36.33万元,对2001年的商品流通费用额作出预测。

解:(1)绘制散点图(图略)。

从图中可清楚看到:随着商品零售额的增加,流通费用率有不断下降的趋势,呈双曲线形状。

(2)建立双曲线模型。

i ii x y εββ++=121 令 i i x x 1'=得 i i i x y εββ++='21(3)估计参数。

Eviews4.0 软件,hzz -暴P92表3-7得回归模型为:ii x y 17610.425680.2+=∧2.间接代换法代换过程和参数估计方法如(暴经济预测P96)表3-8所示。

三、高斯—牛顿迭代法高斯—牛顿迭代法的基本思想是使用泰勒级数展开式去近似地代替非线性回归模型,然后通过多次迭代,多次修正回归系数,使回归系数不断逼近非线性回归模型的最佳回归系数,最后使原模型的残差平方和达到最小。

高斯—牛顿法的一般步骤为: (1)初始值的选择。

其方法有三种,一是根据以往的经验选定初始值;二是用分段法求出初始值;三是对于可线性化的非线性回归模型,通过线性变换,然后施行最小平方法求出初始值。

(2)泰勒级数展开式。

设非线性回归模型为:i i i r x f y ε+=),( i=1,2,…,n (3-68)其中r 为待估回归系数,误差项 i ε~N(0, 2σ),设:')0(1)0(1)0(00),,(-=p g g g g Λ,为待估回归系数'110),,(-=p r r r r Λ的初始值,将(3-68)式),(r x f i 在g 0点附近作泰勒展开,并略去非线性回归模型的二阶及二阶以上的偏导数项,得())0(10)0()0(),(),(),(kkgr p k k i i i g rr r x f g x f r x f -⎥⎦⎤⎢⎣⎡∂∂+≈=-=∑ (3-69) 将(3-69)式代入(3-68)式,则()i k kgr p k k i i i g r r r x f g x f y ε+-⎥⎦⎤⎢⎣⎡∂∂+≈=-=∑)0(10)0()0(),(),(移项:()i k kgr p k k i i i g rr r x f g x f y ε+-⎥⎦⎤⎢⎣⎡∂∂≈-=-=∑)0(10)0()0(),(),(令:)0()0()0()0()0()0(),(),(kk k g r k i ik i i i g r r r x f D g x f y y -=⎥⎦⎤⎢⎣⎡∂∂=-==β 则:i k p k ik iD yεβ+≈∑-=)0(1)0()0( i=1,2,…,n 用矩阵形式表示,上式则为:ε+≈)0()0()0(B D Y (3-70)其中:⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫⎝⎛--=-⨯--⨯⨯)0(1)0(0)0(1)0(1)0(0)0(11)0(10)0()0()0(11)0(1),(),(p p npn p p n n n n B D D D D D g x f y g x f y Y ββM ΛMΛM(3)估计修正因子。

用最小平方法对(3-70)式估计修正因子B (0),则:())0()0(1)0()0()0(''Y D D D b-= (3-71)设g (1)为第一次迭代值,则:)0()0()1(b g g+=(4)精确度的检验。

设残差平方和为:[]21)()0(),(∑=-=ni s i i g x f y SSR ,S 为重复迭代次数,对于给定的允许误差率K ,当k SSR SSR SSR s s s ≤--)()1()(时,则停止迭代;否则,对(3-71)式作下一次迭代。

(5)重复迭代。

重复(3-71)式,当重复迭代S 次时,则有: 修正因子:())()(1)()()(''s s s s s Y D D D b -=第(S+1)次迭代值:)()()1(s s s b g g +=+四、应用举例设12个同类企业的月产量与单位成本的资料如下表:表3-9 间接代换法计算表(注:资料来源《社会经济统计学原理教科书》第435页)试配合适当的回归模型分析月产量与单位产品成本之间的关系。

解:(1)回归模型与初始值的选择。

根据资料散点图的识别,本数据应配合指数模型:i x i ab y =∧对指数模型两边取对数,化指数模型为线性回归模型,然后施行最小平方法求出初始值。

即:b b a a y y bx a y i ii i lg ,lg ,lg lg lg lg '''===+=∧∧∧令:则上述指数模型变为:i ix b a y '''+=∧ i i x y 00831.026109.2'-=∧ 对'',b a 分别求反对数,得182.43,0.981a b ==,带入原模型, 得回归模型:i xi y 981.043.182⨯=∧高斯—牛顿迭代法初始回归模型:(0)(,)182.430.981i xi f x g =⨯残差平方和:(0)(0)2((,))1124.1526i i SSRy f x g =-=∑(2)泰勒级数展开式。

先对指数模型 i xi ab y =∧中的a 和b 分别求偏导数。

0000.981ii a a b b x x i a a b b y b a ==∧==∂==∂11000182.43**0.981i i a a b b x x i a a i i b b y ax b x b--==∧==∂==∂然后用泰勒级数展开指数模型,移项整理得(注:参见(3-69)、(3-70)式):(0)Y(0)D(0)B160-150.5866 0.82545 1535.0316 151-134.2148 0.73571 2189.0282 114-124.3015 0.68137 2534.1796 128-112.9332 0.61905 2878.011085-100.6550 0.55175 3180.7400 a (0)91- 91.4493 = 0.50128 3355.9387 75- 84.6948 0.46246 3453.405276- 76.9488 0.42180 3529.7593 b (0) 66- 68.5829 0.37594 3565.4701 60- 62.3104 0.34156 3556.9658 61- 57.7081 0.31633 3529.5468 60- 52.4302 0.28740 3473.9702(3-72)(3)估计修正因子。

解(3-72)式矩阵,得:a (0)12.09660288=b (0)-0.00180342第一次迭代值:a 1 a 0 a (0)194.5266= + =b 1 b 0 b (0)0.9792第一次迭代回归模型:(1)(,)194.52660.9792i xi f x g =⨯(4)精确度的检验。

残差平方和:(1)(1)2((,))999.4077i i SSR y f x g =-=∑给定误差率K=10-3,则:(1)(0)(1)1124.152610.12482999.4077SSR SSR k SSR -=-=>作下一次迭代。

(5)重复迭代。

将 a 1 代入(3-71)式作第二次迭代。

得估计修正因子:b 1a (1)0.647654043=b (1)-0.000066948第二次迭代值:a 2 a 1 a (1)195.1743= + =b 2 b 1 b (1)0.9791第二次迭代回归模型:(2)(,)195.17430.9791i xi f x g =⨯残差平方和:(2)(2)2((,))999.1241i iSSR yf xg =-=∑ 误差率:(2)(1)(2)999.407710.00028999.1241SSR SSR k SSR -=-=<误差率达到要求,停止迭代。

表3-10计算结果比较从上表可看出:高斯—牛顿迭代法具有收敛快,精确度高的优点,二次迭代就使精确度高达99.97%,相关指数也明显提高。

相关主题