马尔可夫链在天气预测中的应用龚海涛(数学系,093班25号)摘要:马尔可夫链是一种预测方法,模式先假设某一时间各种状态之间的转移概率是基于当前状态的而与其他因素无关,然后利用这一转移概率来推测未来状态的分布情况。
本文将利用马尔可夫链对鞍山市区天气状态进行探究,通过对鞍山市区从2010年2月7号到2012年2月6号共730天的天气历史经验数据进行马尔可夫链分析,得到鞍山市天气状况的稳定分布。
关键字:马尔可夫链;转移概率矩阵一、引言马尔可夫链模型(Markov Chain Model )是一种常用的概率模型也叫马尔可夫分析(Markov Chain Analysis),其原理为利用概率转移矩阵所进行的模拟分析。
此模型为一动态模型,参数可随时间而变,故可以用来预测未来事物变化状态的趋势。
马尔可夫链的基本概念是在1907年由俄国数学家马尔可夫(Markov )从布朗运动(Brown motion )的研究中提出的,后经由Wiener 、Kolmogorve 、Feller 、Doeblin 及Lery 等人的研究整理而于1930到1940年代建立此模型(杨超然,1977)。
二、马尔可夫链的基本介绍定义2.1(Markov 过程)随机过程{X n ,n=0,1,2,3,…}若它只取有限或可列个值E 0,E 1,E 2,…(我们用{0,1,2,…}来标记E 0,E 1,E 2,…,并称它们是过程的状态。
{0,1,2,…}或其子集记为S ,称为过程的状态空间)对任意的n ≥0及状态i, j, i 0, i 1, … i n-1有P{X n+1=j|X 0=i 0,X 1=i 1, …X n-1=i n-1,X n =i}=P{ X n+1=j|X n =i} (2.1)式(2.1)刻画的Markov 链的特性称为Markov 性[1]。
Markov 链表示一个随机序列的条件概率只与最近的系统状态有关,而与先前系统状态无关,所以Markov 性也被称为无后效性[2]。
Markov 性也可以用一句通俗的话来概括——已知现在,将来与过去无关。
定义2.2(转移概率)称式(2.1)中的条件概率P{ X n+1=j|X n =i}为Markov 链{X n ,n=0,1,2,3,…}的一步转移概率,简称转移概率[1]。
定义2.3(时齐马尔可夫链)当Markov 链的转移概率P{ X n+1=j|X n =i}只与状态i,j 有关,而与n 无关时,称Markov 链为时齐的,并记P ij = P{ X n+1=j|X n =i}(n ≥0)。
不管Markov 链的状态是否有限,我们都可以将P ij (i,j ∈S )排成一个矩阵的形式,令()⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛==4342414033323130232221201312111003020100ij P P P P P P P P P P P P P P P P P P P P P P (2.2)定义2.4(转移概率矩阵)称式(2.2)为转移概率矩阵,容易看出P ij (i,j ∈S )有性质 (1)P ij ≥0,i,j ∈S (2)∑iijP=1,S i ∈∀ (2.3)定理2.1(Chapman-kolmogorov,C-K 方程)P)n m (ij+=pp )n (k jSk )m (ik∑∈或P (m+n)=P (m)P (n) (2.4)其中Pm ij= P { X n+m =j|X n =i}为m 步转移概率,⎪⎭⎫ ⎝⎛=p p)m (ij )m (为m 步转移概率矩阵。
三、数据分析因为今天的天气状况很显然与昨天有一定关系而与前天及更早前的关系不大,即天气具有无后效性,所以我们就可以用马尔可夫模型来对未来天气进行模拟预报。
而且这种预测也是很有意义的,因为有一句老话说“天有不测之风云”,所以如果我们能将未来的天气状况预测出来,那对我们的生产生活都很有帮助。
当然了天气预报更科学而且也更准确,我做此文是想仅从历史经验数据出发来预测,因为两种预测方法迥然不同,所以我的预测与天气预报没有可比性。
1. 状态空间的类天气有很多种状态,比如说晴、晴转多云、多云、小雨、中雨、大雨等等。
为了简化研究我按降水与否以及日照或降水强度将天气状态简单分为以下四类,具体分类标准见表1:表1:天气分类标准表原始历史天气数据来自“天气风雨录”网站(/anshan/tianqi )。
一共录得从2010年2月7日到2012年2月6日共计730日的历史天气状况,根据上表的分类标准我们可以将原始数据转换成如表2所示的天气状况数据。
表2 :2010年2月7日到2012年2月6日的天气状况表2. 转移概率矩阵根据表2所示的730日的天气状态数据,可得到729个天气转移情况数据,对这些转移数据进行统计我们可以得到表3:表3:天气转移情况统计表(单位:天数) 根据表3我们可以得到天气变化的一步转移概率矩阵P(1)⎪⎪⎪⎪⎪⎭⎫⎝⎛=255815.0348837.0069767.0325581.0060869.0234783.0252174.0452174.0093024.019186.0261628.0453488.0022556.0097744.0240602.0639098.0)1(P根据C-K 方程(2.4)式我们有P(2)=P(1)*P(1)=P(1)2,所以有⎪⎪⎪⎪⎪⎭⎫⎝⎛=100508.0216348.0202404.048074.006352.0168936.0238222.0529322.0070042.0172017.0242432.0525509.0048516.0139447.0242939.0569098.0)2(P 由P(2)矩阵我们可以看出当前的天气对后天的天气的影响已经很小,如今天“晴”后天“晴”的概率为0.569098,而今天“大”后天“晴”的概率为0.48074,相差无几,这说明我们用马尔可夫链研究天气转移情况是可行的。
同样根据C-K 方程我们还可以得到⎪⎪⎪⎪⎪⎭⎫⎝⎛=068552.0171679.0230191.0529578.0060631.0159265.0236715.0543389.0063378.0159265.0235514.0541843.0056334.01519.0239037.0552729.0)3(P⎪⎪⎪⎪⎪⎭⎫⎝⎛=061345.0160148.0235718.0542789.0059487.0157073.0237064.0546382.0059742.0157476.0236846.0545936.005836.0155203.0237762.0548675.0)4(P ⎪⎪⎪⎪⎪⎭⎫⎝⎛=059048.0156342.0237309.0543301.0059041.015633.0237314.0547316.0059042.0156331.0237313.0547314.0059037.0156327.0237317.0547324.0)8(P 利用C-K 方程我们最终可以求出转移概率矩阵的极限分布如下:()05904.015633.0237316.0547319.0)n (P lim n =∞→3. 不变概率测度定义 3.1(不变测度)对于P,我们还可以得到一个向量π=(π1,π2,π3,π4)使得∑π=πij iji P,()j 0j ∀≥π,j π不全为零则称π为P 的一个不变测度,又若1ii =π∑,则称之为不变概率测度[3]。
命题3.1若π是P 的不变测度,则πP n=π(0n ≥∀)。
根据命题3.1我们可以得到πp=π,其中π=(π1,π2,π3,π4),所以我们可以得到下面的四元一次方程组:⎪⎪⎪⎩⎪⎪⎪⎨⎧=+++=+++=+++=+++=+++ππππππππππππππππππππππππ1255815.0060869.0093024.0022556.0348837.0234783.019186.0097744.0069767.0252174.0261628.0240602.0325581.0452174.0453488.0639098.0432144321343212432114321 解得:⎪⎪⎩⎪⎪⎨⎧====ππππ058352.0156203.0238018.0547427.04321 ,即P 的不变测度(0.547427 0.238018 0.156203 0.058352)。
理论上稳定分布应该等于不变测度但由于计算精度的限制,所以出现了少许误差。
根据不变测度,我们可以看到鞍山市未来某一天“晴”的概率为0.547427,“云”的概率为0.238018,“小”的概率为0.156203,“大”的概率为0.058352.如果不考虑闰年的话那么鞍山一年当中这四种状态天气的天数的预测值分别为200天、86天、57天、22天。
而我们录得的2011年度这四种天气的实际值分别为209天、87天、50天、19天。
理论值与实际值的相对误差只有5.48%,所以这种预测从长期来看是有意义的。
从预测值和理论值我们都能看出鞍山市少雨多晴,如果有人来鞍山短期出差或旅游的话,那么他(她)在某天碰上降雨的天气(即本文中的“小”或“大”天气)的概率只有0.214555,碰上中雨以上降水的天气(即本文中的“大”天气)的概率更是低到0.058352,所以他(她)完全可以不带雨具过来。
而如果他(她)是夏天来的话,碰上晴天(本文中的“晴”天气)的概率为0.547417,所以最好是带着防晒用品。
四、结论本文研究的预测值与理论值较接近,说明天气的变化确实可以用马尔可夫链来预测,当然本文还有很多不足,最大的缺憾就是数据太少,只找到了两年的历史经验数据,如果能有更多数据的话,我相信结果会更合理。
参考文献:[1]张波,张景肖.应用随机过程.北京:清华大学出版社.2004[2]樊平毅.随机过程理论与应用.北京:清华大学出版社.2005[3]钱敏平,龚光鲁.随机过程论.北京:北京大学出版社.1997。