多模型拟合与组合预测对时间序列建模好比替人物画速写;简单几笔素描突出人的特点并由此推测人物个性。
时间序列模型也能模拟数据特征、提炼数据信息、预测数据规律。
然而,正如每张素描仅能反映人物某一侧面,多个角度的素描才能完整逼真人物形象,非线性复杂时间序列的数学模型仅是该序列的某种简化和抽象,其所包含的变量和参数必定是有所选择并十分有限的。
不同模型对同一序列的描述往往各有特点、各有适用场合、也各有不足之处。
理论和实践表明,多模型的拟合与组合预测能提高模拟的功效和预测的精度。
事实上,在预测实践中,对于同个问题,我们常采用不同的预测方法。
不同的预测方法其预测精度往往也不相同。
一般是以预测误差平方和作为评价预测方法优劣的标准,从各种预测方法中选取预测误差平方和最小的预测方法。
不同的预测方法往往能提供不同的有用信息,如果简单地将预测误差平方和较大的方法舍弃,将推动一些有用的信息。
科学的作法是将不同的预测方法进行适当组合,形成组合预测方法。
其目的是综合利用各种预测方法所提供的信息,以提高预测精度。
早在1954年,美国人Schmitt 曾经采用组合预测方法对美国37个最大城市的人口进行预测使预测精度提高。
1959年,J.M.Bate t C 。
W 。
J 。
G 拒有对组合预测方法进行比较系统的研究,研究成果引起预测学者的重视。
此后,国外关于组合预测的研究成果层出不究,我国近十几年也很重视组合预测的研究,取得一系列研究成果。
采用组合预测的关键是确定单个预测方法的加权系数。
设对于同一个问题有)2(≥n 种预测方法。
给出如下记号:t y 为实际观察值;it f 为第i 种方法的预测值;it t it f y e -=为第i 种方法的预测误差;i k 为第i 种方法的加权系数,∑∑====ni ni it i t if k f k11;1为组合预测方法的预测值;t t t f y e -=为组合预测方法的预测误差,于是∑==-=ni it i t t t f k f y e 1。
其中,N t n i ,,2,1;,,2,1 ==。
记组合预测方法的预测误差平方和∑==Ni t e J 12,则⎥⎦⎤⎢⎣⎡=∑∑∑===)(111Nt jt it j i nj ni e e k k J记组合预测方法的预测加权系数向量为T n n k k k ],,,[21 =K ,第i 种预测方法的预测误差向量为T iN i i i e e e ],,,[21 =E ,预测误差矩阵为,,[21E E e = ],n E ,于是n n Tn T K E K e e )(==J中⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=nn n n n n n E E E E E E E E E 212222111211)(E 而∑-====Nt it ii j Tiji ij a E E E 12,i T iE E E E 。
ii E 为第i 种预测方法的预测误差平方和。
)(n E 反映了各种预测方法提供的预测误差信息,称为预测误差信息矩阵。
记T n 1]1,,1,1[⨯= n R ,则国中权系数的约束条件∑==ni i k 11改为1=n K R Tn 。
于是组合预测问题可表示成非线性规划模型(11.1)n n Tn K E K )(min =J(11-1a )⎝⎛≥=01..nn n K K R T t s)111()111(c b --11.1 综合模拟和预测的基本思想自从60年代末模型综合研究开创以来,在经济预测和决策及证券投资等方面得到了有效的应用,但是在统计预测研究和应用方面目前尚属初级阶段。
由前几章的讨论可见,不同的预测模型预测精度往往有差异。
怎样对这些模型的预测结果进行客观的综合应用,一直是人们在探讨的一个问题,眼下大多是人为定性综合。
本章提供一种科学的组合预测方法对模型进行定量综合,以期提高预测结果的可靠性和客观性。
设N t X t ,,2,1},{ =为某个统计量的观测序列,N t J j j xt ,,2,1,,,2,1)},(ˆ{ ==,为对应的用J 个预测模型得到的拟合序列。
对K k x k N ,,2,1,, =用J 个不同模型获得的预测值记为J j j xk N ,,2,1),(ˆ =+,将这J 个模型对k N x+ˆ的组合预测值记为k N x +ˆ,则通常有以下两类综合模式:11.1.1 权重综合K k j x W xk N j Jj k N ,,2,1),(ˆˆ1==+=+∑ (11-2)式中J j W j ,,2,1, =为第j 个模型在综合预测值中所占的权重,一般情况下为了保持综合模型的无偏性,j W 应满足归一化约束条件11=∑=jJj W(11-3)构成j W 的方法有多种,常用的有算术平均法、均方倒数法、方差倒数法、二项式系数法、简单加权法和最优加权法等,将在下面加以介绍。
11.1.2 区域综合设J 种预测值有置信区间J j j j x l N l N ,,2,1)),()(ˆ( =±++δ,则l N x +ˆ的置信区间是这J 个区间的交集))()(ˆ()ˆ(1j j x xl N l N Jj l N l N ++=++±=±δδ (11-4)如果上式为空集,则依次排除该时刻最大和最小预测值的置信区间,若剩余模型超过半数则仍由上式进行区域综合,否则需要新建模预测。
若有模型无法估计置信区间,则将其排除后也按上法处理。
11.2 最优加权法在研究和应用中我们通常较多地采用权重综合的方法,在确定各个模型的权重时,首先想到的是在某一意义上求得最优权重向量,因此下面先讨论最优加权法。
最优加权法的基本原理是依据某种最优准则构造目标函数Q ,在约束条件(记为s.t.)下极小化Q 求得综合模型的加权系数,这些权重系数就是各个模型的最优权。
11.2.1 最优加权模型设N t x t ,,2,1},{ =为观测序列,有J 个预测模型对之进行预测,拟合值记为N t J j j xt ,,2,1,,,2,1)},(ˆ{ ==,则最优加权模型的组合权重系数J j W j ,,2,1, =,是以下规划问题的解:⎪⎩⎪⎨⎧=)(..),,,(min 210t s w w w Q Q J (11-5)式中Q 为目标函数,s. t. 为该规划问题的约束条件。
在有些实际问题中还要求j w 非负,即。
J j w w j j Jj ,,2,1,0,11=≥=∑=(11-6)目标函数Q 的形式由误差统计量及极小化准则的类型确定,常用的误差统计量有以下几种: ① 拟合误差t e)())(ˆ()(ˆˆ111j e w j xx w j x w x xx e t j Jj t j j J j t j Jj t t t t ∑∑∑====-=-=-= (11-7)② 相对误差 t t x e /,(11-8) ③ 对数误差 N t e t ,,2,1, ='t t t x x e ˆlog log -='(11-9)目标函数极小化准则也有多种,最常用的有最小二乘准则、最小一乘准则和极小极大化准则,分别构成如下形式的目标函数:① 2*1)(t Jj e Q ∑==(11-10) ② ||*1t Nt e Q ∑==(11-11) ③ *1max t Nt e Q ≤≤=(11-12)式中误差统计量可从(11-7)—(11-9)式中选取。
以上准则有时还考虑(对时间t )加权的情形。
选取第一种目标函数,以拟合误差为统计量,采用常用的最小二乘准则,则可以获得最优权系数的解析解。
11.2.2 最小二乘准则下综合模型最优权系数我们选取拟合误差t e 为误差统计量,此时的规划模型为⎪⎪⎩⎪⎪⎨⎧==∑∑==1..min 121j Jj t Nt w t s e Q Q (11-13)为求解J j w j ,,2,1, =,将上式表示为矩阵形式,令Jj e e e e j e j e j e e R w w w W N N j j ,2,1,),,,())(,),(),(()1,,1,1(,),,,(212121=====ττττJ J ij t t Nt j i ij e E j e i e e e e ⨯====∑)(),()(1τ(11-14)J J ⨯矩阵E 对称正定,称为信息阵,由上式得:W J e e e j e w x x e t t t t j Jj t t t ))(,),2(),1(()(ˆ1==-=∑=(11-15)W e e e W J e e J e e e e e J N N N ),,,()()1()()1(21111 =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=(11-16)(11-13)式的矩阵形式可表示为:⎪⎩⎪⎨⎧===1..min W R t S EW W e e Q Q τττ (11-17)引入Lagrange 剩子λ,使Q 取极小值的必要条件为:0)1(2(=--W R EW W dWdττλ 即R E W R EW 1,0-==-λλ又由 0))1(2(=--W R EW W d dττλλ得1)(11==-R E R W R λττ即可解得Lagrange 乘子,11)(--=R E R τλ 从而得最优权,W 0和最小Q 值Q 0⎪⎩⎪⎨⎧==-----1101110)()(R E R Q RE R E R W ττ Q 0即为最优综合模型的误差平方和。
为保证1-E 存在,要求J 个模型的误差向量j e 线性无关。
11.2.3 最小二乘准则下最优综合模型的精度分析关于最小二乘法得到的最优综合模型的精度以及最小的目标函数Q 0有以下几个主要结论:结论1:最小二乘法可以求得误差平方和最小的综合预测模型,因而它是最优的,其精度优于其中任何一个单一模型和综合模型。
记00,W Q 对应于最优综合模型;Q ,W 对应任一综合模型;)()(,j j W Q 对应参加综合的第j 个模型,由于目标函数Q 是模型精度的保证,Q 0是Q 的极小值,因此有0Q Q ≥,又有τ)0,,0,1,0,,0()( =j W ,由最优解的唯一性知,除非0)(W W j =,否则必有0Q Q >,因此可以得出上面的结论。
结论2:记min λ和max λ分别为对称正定矩阵的最小和最大特征,则最优综合模型的误差平方和Q 0满足:[2]J Q J //max 0min λλ≤≤(11-18)上式中J 为参加综合的模型个数,该不等式表明,J 越大,Q 0的变化范围越小,Q 0绝不可能减小到J /min λ以下,也不可能超过J /max λ。
结论3:jj Jj e trE J trE Q ∑==≤10,/,其中trE 为矩阵E 的迹由矩阵迹的定义知,J j Jj jj J j e trE λλλ,,,111∑∑====为E 阵的非负特征根。