当前位置:文档之家› Markov链预测法

Markov链预测法

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):贵州民族学院参赛队员(打印并签名) :1. 龚道杰2. 张凤3. 姚肖伟指导教师或指导教师组负责人(打印并签名):日期: 2009 年 7 月 25 日年凝冻日数的Markov链预测法4#【摘要】本文根据所给数据,利用Markov链建立了预测年凝冻日数的模型,分别从整体和局部两个角度进行分析。

首先,我们直接以年凝冻日数为依据,对其进行K-均值聚类分析,划分状态。

用频率估计概率的方法,估算出一步转移概率矩阵,1/65/65/3328/33P ⎡⎤=⎢⎥⎣⎦,然后建立Markov 链模型()1/65/6()(0)(0)5/3328/33nn P n P P P ⎡⎤=⋅=⋅⎢⎥⎣⎦。

以2008年作为初始状态,估计出2009年凝冻日数所处状态为(1)(0)P P P =⋅()0.1520.848=。

按K-均值标准可知,即2009年凝冻的天数在15天以内的可能性为84.8%,在15天以上的可能性为15.2%。

由于上述模型选取的是以年为单位的数据,只能估计出2009年的凝冻日数所处区间。

为提高精度,我们选取2000-2008年的具体凝冻天数和日期,记每一天只存在两种状态,出现雨凇为状态1,否则为状态0。

然后由相邻两年间的状态转移变化,得出一步转移概率矩阵i P ,1,2,...,8i =。

由这8个一步转移概率矩阵,根据一步转移矩阵P 的n 次方与n 步转移概率矩阵()n P 之差的范数和达到最小的准则,选出优化后的一步转移概率矩阵0.95000.0500*0.78890.2111P ⎡⎤=⎢⎥⎣⎦ ,再次建立Markov 链模型。

以2008年为初始状态,预测2009年的概率分布为[]*(2009)(2008)0.91060.0894P P P =⋅= ,由频率稳定于概率,知2009年凝冻天数的估计值为14天。

关键词: Markov 链 转移概率矩阵 频率估计概率1. 问题提出1.1背景知识凝冻是指冬季出现的温度低于0℃有过冷却降水或固体降水和结冰现象发生的天气现象,即气象台所说的出现雨凇的天气。

雨凇的形成与气温,降水量,湿度等因素有关,超冷却的降水碰到温度等于或低于零摄氏度的物体表面使所形成玻璃状的透明或无光泽的表面粗糙并覆盖层,就叫做雨凇。

其造成的危害巨大,高压线塔的倒塌,电力瘫痪,交通瘫痪,农作物的冻亡等。

因而对出现雨凇天气的预测显得尤为重要。

1.2问题分析根据所给1969-2008年的数据,建立一个年凝冻日数的预测模型,预测2009年的凝冻日数,并作出误差分析。

数据给出了是否出现雨凇与气温、降水量、湿度、气压和风速的关系,而雨凇的出现是一个随机过程,与多个因素有关,且受干预变量的影响,因而传统的回归分析方法,效果不好,而Markov 链构造模型不需要从复杂的预测因子中寻找各因素之间的相互规律,只需要考虑事件本身的演变特点,通过计算转移概率矩阵来预测内部状态的变化。

2. 建模准备 2.1数据分析与处理以年为单位,统计出现雨凇的天数,见表1:2.2 Markov 链预测的理论基础 2.2.1 Markov 链定义(Markov 链)[1] 随机过程{Xn ,0,1,2...n =}称为Markov 链,若它只取有限或可列个值012,,,...E E E (我们以{0,1,2,...}来标记01,,...,E E 并称它们是过程的状态,{0,1,2...}或者其子集记为S ,称为过程的状态空间).对任意的0n ≥及状态011,,,...,,n i j i i i -有1{n P X j +=︱00112211,,,...,,n n n X i X i X i X i X i --=====} =1{n P X j +=︱}.n X i = (5.1.1) 式(5.1.1)刻画了Markov 链的特性,称为Markov 性。

2.2.2 转移概率矩阵由转移概率组成的矩阵,形如000102101112202122......()...ij p p p pp p P p p p p ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦称P 为转移概率矩阵。

且ij p (,)i j S ∈有性质: (1)0,,;ij p i j S ≥∈(2)1,.ij j sp i S ∈=∀∈∑ 【2】2.2.3(C-K 方程) 对一切,0,,n m i j S ≥∈有()(1);m n m nij ik kj k sp p p +∈=∑(1)(2)(2).n n n P P P P P P P --=⋅=⋅⋅=⋅⋅⋅=(n) 其证明如下:{}()0|m n ij m n p p X j X i ++===={}{}00,m n p X j X i p X i +===={}{}00,,m n m k sp X j X k X i p X i +∈====∑(全概率公式)={}{}{}{}0000,,,,m n m m k sm p X j X k X i p X k X i p X i p X k X i +∈========∑={}{}00|,|m n m m k sp X j X k X i p X k X i +∈=====∑=()()n m kj ikk sp p ∈∑ =()()m n ik kj k sp p ∈∑ 【3】2.3.4 传统的频率估计概率估算一步转移概率矩阵的方法为:已知系统存在n 种状态,状态空间为S ={0,1,2,…n}.假设在N次观测中,系统处于第i 种状态共有i n 次,显然1nj j N n ==∑.用ij n 表示系统从状态i经过一步转移到状态j 的频数,显然有1,(,),ni ij ij j n n i j S n ==∈∑组成的矩阵()ij n 称为转移频数矩阵。

将转移频数矩阵的第i 行第j 列元素ij n 除以i 行各元素总和所得的值称为转移概率,记为,,ij p i j I ∈。

即有/ij ij i p n n =,于是我们得到用频率估计出一步转移概率矩阵P .【4】3.符号说明符号 说明i t 第j 期的概率分布ij P 从状态i 到状态j 的转移概率I 状态空间且{0,1}I = i t 频率4.模型的建立4.1 模型假设1)雨凇的年出现次数是一簇依赖于时间的随机变量,其变化过程是一个随机过程;2)该随机过程具有无后效性;3)雨凇年出现次数状态的一步转移概率矩阵只与时间差有关,与时间起点无关。

4.2模型建立4.2.1以表1为基础,建立Markov 链预测模型 :1)利用SPSS 软件,以K 均值聚类法将过去的年凝冻日数分为2个区间,确定每年凝冻日数的状态,见表2:2)根据表2,以频率估计概率的方法,计算一步转移概率矩阵。

出现状态1的次数为716-=,出现状态2的次数为33。

由1转为1的次数为1,故转移概率111/6P =;由1转为2的次数为5,故转移概率125/6P=;由2转为1的次数为5,故转移概率215/33P =;由2转为2的次数为28,故转移概率22=28/33P 。

由此可得雨凇年出现次数状态的一步转移概率矩阵为:1/65/65/3328/33P ⎡⎤=⎢⎥⎣⎦; Markov 链的基本原理就是利用初始状态概率向量和状态转移概率矩阵来推知预测对象将来一个时期所处的状态。

记0(0){},j P P X j j S ==∈,则有12(0)((0),(0),...,(0),...)j P P P P =,称它为Markov 链的初始分布,显然有(0)1j j SP ∈=∑。

由上述 C-K 方程 可知Markov 链在任一时刻n 的一维分布由初始分布(0)P 和n 步转移概率矩阵所确定。

即Markov 链的预测模型为 ()1/65/6()(0)(0)5/3328/33nn P n P P P ⎡⎤=⋅=⋅⎢⎥⎣⎦。

(1)4.2.2 根据所建Markov 链模型,进行预测用2008年凝冻天数作为初始状态,即()(0)01P =.利用模型(1)式,计算可得2009年凝冻天数的一维分布为:()1/65/6(1)(0)015/3328/33P P P ⎛⎫=⋅=⋅ ⎪⎝⎭()0.1520.848=这表明2009年的凝冻天数所处的状态为1的概率为0.152,状态为2的概率为0.848.由之前SPSS 软件的K-均值聚类可知,凝冻的天数在15天以内的可能性为84.8%,在15天以上的可能性为15.2%。

4.3 模型检验和结果分析该模型虽然预测出了2009年凝冻日数的范围,并计算出其以84.8%的概率稳定于该状态,却无法的估计出2009年凝冻的具体天数。

由于凝冻基本发生在1月、2月、3月、11月、12月,而2009年前三个月的历史天气数据可以查得,见数据1 【5】2009年贵阳雨淞出现的次数日期 雨淞出现 日期 雨淞出现 日期 雨淞出现 1-1 1 2-1 0 3-1 0 1-2 0 2-2 0 3-2 0 1-3 0 2-3 0 3-3 0 1-4 1 2-4 0 3-4 0 1-5 0 2-5 0 3-5 0 1-6 1 2-6 0 3-6 0 1-7 1 2-7 0 3-7 0 1-8 0 2-8 0 3-8 0 1-9 0 2-9 0 3-9 0 1-10 0 2-10 0 3-10 0 1-11 0 2-11 0 3-11 0 1-12 0 2-12 0 3-12 0 1-13 0 2-13 0 3-13 0 1-14 0 2-14 0 3-14 0 1-15 0 2-15 0 3-15 0 1-16 0 2-16 0 3-16 0 1-17 0 2-17 0 3-17 0 1-18 0 2-18 0 3-18 0 1-19 0 2-19 0 3-19 0 1-20 0 2-20 0 3-20 0 1-21 0 2-21 0 3-21 0 1-22 0 2-22 0 3-22 0 1-23 0 2-23 0 3-23 0 1-24 1 2-24 0 3-24 0 1-25 1 2-25 0 3-25 0 1-26 1 2-26 0 3-26 0 1-27 1 2-27 0 3-27 01-28 0 2-28 0 3-28 01-29 0 3-29 01-30 0 3-30 01-31 0 3-31 0由数据1可得,2009年发生凝冻1月天数为8天,2月天数为0天,3月天数为0天。

相关主题