近代时间序列分析选讲:一. 非线性时间序列二. GARCH模型三. 多元时间序列四. 协整模型非线性时间序列第一章.非线性时间序列浅释1.从线性到非线性自回归模型2.线性时间序列定义的多样性第二章. 非线性时间序列模型1. 概述2. 非线性自回归模型3.带条件异方差的自回归模型4.两种可逆性5.时间序列与伪随机数第三章.马尔可夫链与AR模型1. 马尔可夫链2. AR模型所确定的马尔可夫链3. 若干例子第四章. 统计建模方法1. 概论2. 线性性检验3.AR模型参数估计4.AR模型阶数估计第五章. 实例和展望1. 实例2.展望第一章.非线性时间序列浅释1. 从线性到非线性自回归模型时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明.考查一阶线性自回归模型---LAR(1): x t=αx t-1+e t, t=1,2,… (1.1)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到x t=αx t-1+e t= e t + αx t-1= e t + α{ e t-1 + αx t-2}= e t + αe t-1 + α2 x t-2=…= e t + αe t-1 + α2e t-2+…+ αn-1e t-n+1 +αn x t-n. (1.2)如果当n→∞时,αn x t-n→0, (1.3){e t+αe t-1+α2e t-2+…+αn-1e t-n+1}→∑j=0∞αj e t-j . (1.4)虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为x t=∑j=0∞αj e t-j . (1.5)通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):x t =α1x t-1+α2x t-2+...+αp x t-p +e t ,t=1,2,… (1.6)其中{e t }为i.i.d.序列,且Ee t =0, Ee t =σ2<∞,而且e t 与{x t-1, x t-1,…}独立.虽然反复使用(1.6)式的递推式, 仍然可得到(1.2)式的类似结果, 但是,用扩张后的一阶多元AR 模型求解时, 可显示出与LAR(1)模型求解的神奇的相似. 为此记X t =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+--11p t t t x x x , U=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛001 , A=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛00000121 pααα, (1.7)于是(1.6)式可写成如下的等价形式:X t=A X t-1+ e t U. (1.8)反复使用此式的递推关系, 形式上仿照(1.2)式可得X t=AX t-1+e t U= e t U+e t-1AU+A2x t-2=⋯=e t U+e t-1AU+e t-2A2U+…+e t-n+1A n-1U+A n x t-n.如果矩阵A的谱半径(A的特征值的最大模)λ(A), 满足如下条件λ(A)<1, (1.10) 由上式可猜想到(1.8)式有如下的解: X t=∑k=0∞A k Ue t-k. (1.11)其中向量X t的第一分量x t形成的序列{x t}, 就是模型(1.6)式的解. 由此不难看出, 它有以下表达方式x t=∑k=0∞ϕk e t-k. (1.11)其中系数ϕk由(1.6)式中的α1,α2, ... ,αp 确定, 细节从略. 不过, (1.11)式给了我们重要启发, 即考虑形如x t=∑k=0∞ψk e t-k, ∑k=0∞ψk2<∞, (1.12)的时间序列类 (其中系数ψk能保证(1.12)式中的x t有定义). 在文献中, 这样的序列{x t}就被称为线性时间序列.虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1), 以便与LAR(1)模型进行比较分析. 首先写出NLAR(1)模型如下x t=ϕ(x t-1)+e t, t=1,2,… (1.13)其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞,而且e t与{x t-1,x t-2,…}独立, 这些假定与LAR(1)模型相同, 但是, ϕ(x t-1)不再是x t-1的线性函数, 代之为非线性函数, 比如ϕ(x t-1)=x t-1/{a+bx t-12}.此时虽然仍可反复使用(1.13)式进行迭代, 但是所得结果是x t=ϕ (x t-1) +e t= e t+ ϕ (x t-1)= e t+ ϕ ( e t-1+ ϕ (x t-2))= e t+ ϕ ( e t-1+ ϕ ( e t-2+ ϕ (x t-3))) =…=e t+ϕ ( e t-1+ ϕ ( e t-2+ …+ϕ (x t-n))…).(1.14)根据此式, 我们既不能轻易判断ϕ(x t-1)函数满足怎样的条件时, 上式会有极限, 也不能猜测其极限有怎样的形式.对于p阶非线性自回归模型x t =ϕ(x t-1,x t-2,…,x t-p )+e t ,t=1,2,… (1.15)仿照(1.6)至(1.9)式的扩张的方法, 我们引入如下记号Φ( x t-1,x t-2,…,x t-p )≡⎪⎪⎪⎪⎪⎭⎫ ⎝⎛+-----1121,...,,(p t t p t t t x x x x x ϕ, (1.16)我们得到与(1.15)式等价的模型X t =Φ(X t-1) +e t U, t=1,2,… (1.17)但是, 我们再也得不出(1.9)至(1.14)式的结果,至此我们已将看出, 从线性到非线性自回归模型有实质性差异, 要说清楚它们, 并不是很简单的事情. 从数学角度而言,讨论线性自回归模型可借用泛函分析方法, 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法. 这也正是本讲座要介绍的主要内容.2. 线性时间序列定义的多样性现在简单叙述一下非线性时间序列定义的复杂性, 它与线性时间序列的定义有关. 前一小节中(1.12)式所显示的线性时间序列, 只是一种定义方式. 如果改变对系数 k的限制条件, 就会给出不同的定义. 更为重要的是, 在近代研究中, 将(1.12)式中的i.i.d.序列{e t}放宽为平稳鞅差序列, 这在预报理论中很有意义.无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其研究成果可用于有关的线性时间序列模型解的特性研究. 事实上, 已经有丰富的成果被载入文献史册.依上所述可知, 由于线性时间序列定义的多样性, 必然带来非线性时间序列定义的复杂性. 这里需要强调指的是, 对于非线性时间序列, 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同. 于是人们要问, 我们用哪些工具来研究非线性时间序列模型解的特性呢? 这正是本次演讲要回答的问题. 确切地说, 我们将介绍马尔可夫链, 并借助于此来讨论非线性自回归模型解的问题.第二章. 非线性时间序列模型1. 概论从(1.12)式可见,一个线性时间序列{x t}, 被{e t}的分布和全部系数 i 所决定. 在此有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如ARMA模型. 对于非线性时间序列而言, 使用参数模型方法几乎是唯一的选择. 由于非线性函数的多样性, 带来了非线性时间序列模型的多样性. 但是, 迄今为止被研究得较多, 又有应用价值的非线性时序模型, 为数极少, 而且主要是针对非线性自回归模型. 在介绍此类模型之前, 我们先对非线性时序模型的分类作一概述.通用假定: {εt}为i.i.d.序列,且Eεt=0, 而且εt与{x t-1, x t-2,…}独立.可加噪声模型:x t=ϕ(x t-1,x t-2,…)+εt,t=1,2,… (2.1)其中ϕ(…)是自回归函数. 当它仅依赖于有限个未知参数时, 记此参数向量为α, 其相应的(2.1)模型常写成x t=ϕ(x t-1,x t-2,…;α)+εt,t=1,2,… (2.2)否则, 称(2.1)式称为非参数模型.关于(2.1)(2.2)的模型的平稳性, 要在下一章讨论, 但是, 它有类似于线性AR 模型的几个简单性质, 是重要的而且容易获得的, 它们是:E(x t|x t-1,x t-2,…)=E{ϕ(x t-1,x t-2,…)+εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…)+E(εt|x t-1,x t-2,…)=ϕ(x t-1,x t-2,…) (2.3)var{x t|x t-1, x t-2 , …}≡E{[x t-ϕ(x t-1,…)]2|x t-1, x t-2 , …}= E{εt2|x t-1, x t-2 , …}= Eεt2=σ2. (2.4)P{x t<x|x t-1,x t-2, …}= P{ϕ(x t-1,…)+εt<x|x t-1,x t-2, …}= P{εt<x-ϕ(x t-1,…)|x t-1,x t-2, …}=Fε(x-ϕ(x t-1,…)). (2.5)其中Fε是εt的分布函数.带条件异方差的模型:x t=ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)εt,t=1,2,… (2.6)其中ϕ(…)和S(…)也有限参数与非参数型之分, 这都是不言自明的. 另外, (2.6)式显然不属于可加噪声模型. 但是, 它比下面的更一般的非可加噪声模型要简单得多.这可通过推广(2.3)(2.4)(2.5)式看出, 即有,E(x t|x t-1,x t-2,…)=E{ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…)+S(x t-1,x t-2,…)E{εt|x t-1,x t-2,…}=ϕ(x t-1,x t-2,…) .(2.3)’var{x t|x t-1, x t-2 , …}≡E{[x t-ϕ(x t-1,…)]2|x t-1, x t-2 , …}=E{S2(x t-1,x t-2,…)εt2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)E{εt2|x t-1, x t-2 , …}=S2(x t-1,x t-2,…)σ2. (2.4)’P{x t<x|x t-1,x t-2, …}=P{ϕ(x t-1,…)+S(x t-1,…)εt<x|x t-1, x t-2 , …}= P{εt<[x-ϕ(x t-1,…)]/S(x t-1,…)}=Fε([x-ϕ(x t-1,…)]/S(x t-1,…)).(2.5)’一般非线性时序模型:x t=ψ(x t-1,x t-2,…; εt, εt-1,…)t=1,2,… (2.7)其中ψ(…)也有参数与非参数型之区别, 这也是不言自明的. 显然, (2.7)式既不是可加噪声模型, 也不属于(2.6)式的带条件异方差的模型. 虽然, 它可能具有条件异方差性质. 相反, 后两者都是(2.7)式的特殊类型. 虽说(2.7)式是更广的模型形式, 在文献中却很少被研究. 只有双线性模型作为它的一种特殊情况, 在文献中有些应用和研究结果出现. 现写出其模型于后, 可供理解其双线性模型的含义x t=∑j=1pαj x t-j+∑j=1qβjεt-j+∑i=1P∑j=1Qθijεt-i x t-j.2. 非线性自回归模型在前一小节中的(2.1)和(2.2)式就是非线性自回归模型, 而且属于可加噪声模型类. 在这一小节里, 我们将介绍几种(2.2)式的常见的模型.函数后的线性自回归模型:f(x t)=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+ε,tt=1,2,… (2.8)其中f(.)是一元函数, 它有已知和未知的不同情况, 不过总考虑单调增函数的情况, α=(α1,α2,…,αp)τ是未知参数. 在实际应用中, {x t}是可获得量测的序列.当f(.)是已知函数时, {f(x t)}也是可获得量测的序列, 于是只需考虑y t=f(x t)所满足的线性AR模型y t=α1y t-1+α2y t-2+...+αp y t-p+εt,t=1,2,… (2.9)此时可不涉及非线性自回归模型概念. 在宏观计量经济分析中, 常常对原始数据先取对数后, 再作线性自回归模型统计分析, 就属于此种情况. 这种先取对数的方法, 不仅简单, 而且有经济背景的合理解释,它反应了经济增长幅度的量化规律. 虽然在统计学中还有更多的变换可使用, 比如Box-Cox变换, 但是, 由于缺少经济背景的合理解释, 很少被使用. 由此看来, 当f(.)有实际背景依据时, 可以考虑使用(2.7)式的模型.当f(.)是未知函数时, {f(x t)}不是可量测的序列, 于是只能考虑(2.8)模型. 注意f(.)是单调函数, 可记它的逆变换函数为f-1(.), 于是由(2.8)模型可得x t= f-1(α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt),t=1,2,… (2.9)’此式属于(2.7)式的特殊情况, 此类模型很少被使用. 取而代之是考虑如下的模型x t=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,t=1,2,… (2.10)其中f(.)是一元函数, 也有已知和未知之分, 可不限于单调增函数. 此式属于(2.1)式的特殊情况, 有一定的使用价值.当(2.10)式中的f(.)函数是已知时, 此式还有更进一步的推广模型,x t=α1f1(x t-1,…,x t-s)+α2f2(x t-1,…,x t-s)+...+αp f p (x t-1,…,x t-s )+εt ,t=1,2,… (2.11)其中f k (…)(k=1,2,…,p)是已知的s 元函数.例如, 以后将要多次提到的如下的模型:x t =α1I(x t-1<0)x t-1+α2I(x t-1≥0)x t-1+εt ,t=1,2,… (2.12)其中I(.)是示性函数. 此模型是分段线性的, 是著名的TAR 模型的特殊情况. 为了有助于理解它, 我们写出它的分段形式:x t =.0,0,,111211≥<⎩⎨⎧++--t t t t x x x x εαεα t=1,2,…请注意, (2.8)(2.10)和(2.11)式具有一个共同的特征, 就是未知参数都以线性形式出现在模型中. 这一特点在统计建模时带来极大的方便. 此类模型便于实际应用. 但是, 对于{x t }而言不具有线性特性, 所以, 讨论它们的平稳解的问题, 讨论它们的建模理论依据问题,都需要借助于马尔可夫链的工具.已知非线性自回归函数的模型:x t =ϕ(x t-1,x t-2,…,x t-p ;α)+εt ,t=1,2,… (2.13)其中ϕ(…)是p 元已知函数, 但是其中含有未知参数α=(α1,α2,…,αp )τ.一般说来, α在一定范围内取值.例如,x t =tt t x x εαα++--212111, t=1,2,…其中α=(α1,α2)τ是未知参数, 它们的取值范围是: -∞<α<∞, 0≤α<∞.这里需要指出, 使用上式的模型,不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦, 二是确定ϕ(…)函数的麻烦. 一般来说, 只有根据应用背景能确定ϕ(…)函数时, 才会考虑使用此类模型.广义线性模型(神经网络模型):x t=ϕ(α1x t-1+α2x t-2+…+αp x t-p)+εt,t=1,2,… (2.14)其中ϕ(.)是一元已知或未知函数, 参数α=(α1,α2,…,αp)τ总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对α作些约定, 其一, ||α||=1, 其二, α=(α1,α2,…,αp)τ中第一个非零分量为正的. 不难理解, 若不加这两条约定, 模型(2.14)不能被唯一确定.当ϕ(.)是一元已知函数时, 与神经网络模型相通.当ϕ(.)是一元未知函数时, 与回归模型中的PP方法相通.除了以上两类模型外, 还有(2.1)式的非参数自回归模型, 以及从统计学中引入的半参数自回归模型. 对它们的统计建模更困难. 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题, 对这类模型不再仔细讨论.Welcome !!! 欢迎您的下载,资料仅供参考!。